<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>統計学的検定 &#8211; いちばんやさしい、医療統計</title>
	<atom:link href="https://best-biostatistics.com/tag/%E7%B5%B1%E8%A8%88%E5%AD%A6%E7%9A%84%E6%A4%9C%E5%AE%9A/feed" rel="self" type="application/rss+xml" />
	<link>https://best-biostatistics.com</link>
	<description>数式にとらわれない、イメージとしての統計！</description>
	<lastBuildDate>Mon, 21 Jul 2025 01:16:15 +0000</lastBuildDate>
	<language>ja</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	<generator>https://wordpress.org/?v=6.9.4</generator>

<image>
	<url>https://best-biostatistics.com/wp/wp-content/uploads/2024/04/cropped-Data-Seed-Inc.-logo-I-32x32.png</url>
	<title>統計学的検定 &#8211; いちばんやさしい、医療統計</title>
	<link>https://best-biostatistics.com</link>
	<width>32</width>
	<height>32</height>
</image> 
<atom:link rel="hub" href="https://pubsubhubbub.appspot.com"/>
<atom:link rel="hub" href="https://pubsubhubbub.superfeedr.com"/>
<atom:link rel="hub" href="https://websubhub.com/hub"/>
<atom:link rel="self" href="https://best-biostatistics.com/tag/%E7%B5%B1%E8%A8%88%E5%AD%A6%E7%9A%84%E6%A4%9C%E5%AE%9A/feed"/>
	<item>
		<title>多重性の調整方法は？閉手順など検定の多重性を補正する3つの方法</title>
		<link>https://best-biostatistics.com/multiple/avoid.html</link>
					<comments>https://best-biostatistics.com/multiple/avoid.html#comments</comments>
		
		<dc:creator><![CDATA[beat1115]]></dc:creator>
		<pubDate>Mon, 21 Jul 2025 01:00:07 +0000</pubDate>
				<category><![CDATA[統計学的検定における、多重性の問題とは？]]></category>
		<category><![CDATA[P値]]></category>
		<category><![CDATA[多重性]]></category>
		<category><![CDATA[統計学的検定]]></category>
		<guid isPermaLink="false">http://best-biostatistics.com/wp/2016/02/07/avoid/</guid>

					<description><![CDATA[<p><img src="https://best-biostatistics.com/wp/wp-content/uploads/2022/05/統計のYoutubeアイキャッチ-17-1024x576.jpg" class="webfeedsFeaturedVisual" /></p>多重性という言葉を聞いたことがありますか？知っている方も、どうすればそれを回避できるか知っていますか？色々と知っていることが武器になりますよ。
]]></description>
										<content:encoded><![CDATA[<p><img src="https://best-biostatistics.com/wp/wp-content/uploads/2022/05/統計のYoutubeアイキャッチ-17-1024x576.jpg" class="webfeedsFeaturedVisual" /></p>
<p>統計学的検定の多重性は、医薬研究でかなり問題となります。</p>



<p>多重性の問題が、試験の計画段階で統計の専門家が一番頭を悩ませる点といっても過言ではありません。</p>



<p>そんな検定の多重性の問題ですが、調整する方法はあるのでしょうか？</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>この記事では、まずは医薬研究で多重性が発生する状況をまとめます。</p>



<p>そして、統計学的検定の多重性を補正する方法を3つ紹介します！</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">多重性を調整する必要がある状況：検定を2回以上実施すれば多重性の問題は起こる</h2>


<div class="wp-block-image">
<figure class="aligncenter"><img decoding="async" width="640" height="340" src="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/2ae4ec48eb55ae189560e8bb40caa89f_s-e1577089193118.jpg" alt="" class="wp-image-2529" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/2ae4ec48eb55ae189560e8bb40caa89f_s-e1577089193118.jpg 640w, https://best-biostatistics.com/wp/wp-content/uploads/2019/10/2ae4ec48eb55ae189560e8bb40caa89f_s-e1577089193118-300x159.jpg 300w" sizes="(max-width: 640px) 100vw, 640px" /></figure>
</div>


<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>多重性は、<a href="https://best-biostatistics.com/multiple/alpha.html" target="_blank" rel="noopener noreferrer"><strong>複数回の検定（2回以上の検定）を実施する際に起こる問題</strong></a>です。</p>



<p>なぜ２回以上検定をすると問題なのか。</p>



<p>それは、<strong>試験全体として<a href="https://best-biostatistics.com/hypo_test/error.html" data-type="post" data-id="41">αエラー</a>が大きくなってしまうから</strong>です。</p>



<p><a href="https://best-biostatistics.com/hypo_test/significant.html">統計的検定が有意水準を５％として設定</a>していることは、誰もが知っていますよね。</p>



<p>そのαエラーが５％を超えてしまうということは、とても重大な問題であると認識できるかと思います。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>それでは、臨床試験ではどのような状況で多重性の問題が出てくるでしょうか？</p>



<p>具体的には以下の３つの状況が考えられます。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<div class="boldBox">
<ol>
<li><strong><span style="font-size: 16px;">主要エンドポイントが2つ以上ある場合</span></strong></li>
<li><strong><span style="font-size: 16px;">比較する群が複数ある場合</span></strong></li>
<li><strong><span style="font-size: 16px;">解析する時点が複数ある場合</span></strong></li>
</ol>
</div>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>どういう状況か、もう少し考えてみましょう。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading">多重性の調整が必要な状況1：主要エンドポイントが複数ある場合</h3>



<p>これは一番イメージしやすい状況かもしれません。</p>



<p><span class="marker">主要エンドポイントを複数設定し、そのうち「どれか一つでも達成」すれば試験の目的を達成する。</span></p>



<p>そんな状況であれば、多重性の問題が発生します。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>例えば、アトピー性皮膚炎という疾患があります。</p>



<p>この疾患は、皮膚炎とかゆみの2つの特徴を持つ疾患です。</p>



<p>その時、<span class="marker">主要エンドポイントを「皮膚炎の改善」と「かゆみの改善」の2つ</span>にしたとします。</p>



<p>皮膚炎だけが改善すればアトピー性皮膚炎の薬として申請し、かゆみだけが改善すればアトピー性皮膚炎に伴うかゆみの改善薬として申請する。</p>



<p>上記のような戦略を取るのであれば、どっちかのエンドポイントで達成できなくても、申請ができる。</p>



<p>これではいいとこ取りになりますよね。</p>



<p>つまり、多重性の問題があるということになります。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading">多重性の調整が必要な状況2：比較する群が複数ある場合</h3>



<p>この状況も、多重性の問題が出てきます。</p>



<p>例えば、Phase II試験までに用量を決めきれずに、実薬群は低用量と高用量の2用量でPhase III試験を実施したとします。</p>



<p>すると、</p>



<ol class="wp-block-list">
<li><strong>プラセボ群</strong></li>



<li><strong>低用量実薬群</strong></li>



<li><strong>高用量実薬群</strong></li>
</ol>



<p>の3群で試験を実施することになります。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>この時Phase IIIの比較は<strong><span class="marker">「プラセボ群vs低用量群」「プラセボ群vs高用量群」の2つの比較をすることになります</span></strong>。</p>



<p>その際に、<strong><span class="marker">どちらか一方でも有意になればその用量で申請するという戦略にしている場合、この時にも多重性の問題が出てきます</span></strong>。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading">多重性の調整が必要な状況3：解析する時点が複数ある場合</h3>



<p>2つ目の状況は、解析する時点が複数ある場合です。</p>



<p>具体的にいうと、中間解析を実施する場合です。</p>



<p>例えば、1年間の試験の場合に、半年時点で一回解析を計画するような場合。</p>



<p>この時に、</p>



<ol class="wp-block-list">
<li><strong>試験開始から半年後に1度検定する</strong></li>



<li><strong>試験開始から1年後に2回目の検定をする</strong></li>
</ol>



<p>というように、2回の検定をすることになりますね。</p>



<p>そして、<span class="marker">半年時点もしくは1年時点のいずれかの結果が有意であれば試験の目的を達成する</span>という状況であれば、これも多重性の問題が出て来ます。</p>



<p>また、中間解析ではなくとも、経時的にデータを取得し、いずれかの時点で有意かどうかを判定する際にも、多重性の問題が発生します。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">複数検定する場合でも、多重性の調整が必要ない状況</h2>


<div class="wp-block-image">
<figure class="aligncenter"><img decoding="async" width="640" height="323" src="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/7f418be16ff229275d0670150ea529e0_s-e1577088780405.jpg" alt="" class="wp-image-2528" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/7f418be16ff229275d0670150ea529e0_s-e1577088780405.jpg 640w, https://best-biostatistics.com/wp/wp-content/uploads/2019/10/7f418be16ff229275d0670150ea529e0_s-e1577088780405-300x151.jpg 300w" sizes="(max-width: 640px) 100vw, 640px" /></figure>
</div>


<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>複数の検定を実施する場合でも、多重性の問題が出てこない状況があります。</p>



<p>それは<strong>「複数の検定全てで有意になる場合に目的を達成する」場合</strong>です。</p>



<p>例えば2つの主要エンドポイントがあった時に、<strong><span class="marker">どちらか一方が有意</span></strong>になれば試験の目的を達成する場合には多重性の問題が出てきますが、<strong><span class="marker">どちらも有意</span></strong>にならない限り試験の目的を達成しない、というような場合には多重性の問題が出てきません。</p>



<p>さいころの例だと、2回投げた時に、<strong><span class="marker">どちらか1回でも6が出る確率というのが多重性の問題</span></strong>が発生する状況ですが、<strong><span class="marker">2回とも6が出る確率というのは1回よりも厳しくなります</span></strong>。</p>



<p>そのため、<span style="text-decoration: underline;"><strong>αエラーという観点では、「どちらか一方をいいとこ取りする」という状況でなければ多重性の問題が発生しない</strong></span>のです。</p>



<p><span style="color: #ff0000;"><strong>AもしくはB</strong></span>の状況では多重性の問題が発生しますが、<span style="color: #ff0000;"><strong>AかつB</strong></span>の状況では多重性の問題が発生しません。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>少しだけ、αエラーを図式化してみます。</p>



<p>1回だけ検定をした場合、αエラーは全体（100%）の中で5%を占めますね。</p>



<figure class="wp-block-image"><img decoding="async" width="883" height="452" src="https://best-biostatistics.com/wp/wp-content/uploads/2016/02/a-1.png" alt="" class="wp-image-1563" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2016/02/a-1.png 883w, https://best-biostatistics.com/wp/wp-content/uploads/2016/02/a-1-300x154.png 300w, https://best-biostatistics.com/wp/wp-content/uploads/2016/02/a-1-768x393.png 768w" sizes="(max-width: 883px) 100vw, 883px" /></figure>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>では、２回検定をした場合。</p>



<p>その場合には、以下のような図になります。</p>



<p>１回目のαエラーと２回目のαエラーがあり、その一部が重なっているような図です。</p>



<figure class="wp-block-image"><img decoding="async" width="883" height="462" src="https://best-biostatistics.com/wp/wp-content/uploads/2016/02/a-2.png" alt="" class="wp-image-1564" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2016/02/a-2.png 883w, https://best-biostatistics.com/wp/wp-content/uploads/2016/02/a-2-300x157.png 300w, https://best-biostatistics.com/wp/wp-content/uploads/2016/02/a-2-768x402.png 768w" sizes="(max-width: 883px) 100vw, 883px" /></figure>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>この時、「もしくは」の状況（１回でもαエラーが生じる確率）は二つの円の総面積になります。</p>



<p>つまり、0.05+0.05-0.05*0.05=0.0975となります。この0.0975が0.05より大きいため、問題となります。</p>



<p>ですが、「かつ」の状況（２回ともαエラーが生じる確率）は二つの円が重なっている面積になります。</p>



<p>つまり、0.05*0.05=0.0025となります。この0.0025は0.05よりも大きいので、多重性という点では問題ないことになります。</p>



<figure class="wp-block-image"><img decoding="async" width="883" height="402" src="https://best-biostatistics.com/wp/wp-content/uploads/2016/02/a-.png" alt="" class="wp-image-1565" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2016/02/a-.png 883w, https://best-biostatistics.com/wp/wp-content/uploads/2016/02/a--300x137.png 300w, https://best-biostatistics.com/wp/wp-content/uploads/2016/02/a--768x350.png 768w" sizes="(max-width: 883px) 100vw, 883px" /></figure>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">閉手順など多重性を回避する３つの方法は？</h2>


<div class="wp-block-image">
<figure class="aligncenter"><img decoding="async" width="640" height="345" src="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/987eca87017b5f2fa265f89558d4724a_s-e1577496841202.jpg" alt="" class="wp-image-2530" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/987eca87017b5f2fa265f89558d4724a_s-e1577496841202.jpg 640w, https://best-biostatistics.com/wp/wp-content/uploads/2019/10/987eca87017b5f2fa265f89558d4724a_s-e1577496841202-300x162.jpg 300w" sizes="(max-width: 640px) 100vw, 640px" /></figure>
</div>


<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>複数回検定してそのうちどれかが有意になる場合、多重性の問題が生じます。</p>



<p>では、どうすれば多重性の問題を回避することが出来るでしょうか？</p>



<p>よく行われる回避方法としては、3つ挙げられます。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<div class="boldBox">
<ol>
<li><strong><span style="font-size: 16px;">検定をどうにかして一つにする</span></strong></li>
<li><strong><span style="font-size: 16px;">検定に順番を付ける</span></strong></li>
<li><strong><span style="font-size: 16px;">有意水準を調整する</span></strong></li>
</ol>
</div>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>では、この３つに関して詳細にみていきましょう。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading">多重性の回避方法1：検定をどうにか一つにする</h3>



<p>これは、多重性を回避するのに一番シンプルな方法です。</p>



<p>複数回の検定に問題があるのであれば、一つにすればよいということです。</p>



<p>主要エンドポイントが複数あれば、一つに選ぶか、複数のエンドポイントを合成して一つにしてしまう（合成変数の作成）がアイデアとして挙げられます。</p>



<p>合成変数を作成する場合には、その変数がちゃんと使えるかどうかという評価をしなければならない、という新たな問題が出てくるため、<strong>一つに選ぶという方法が一番シンプル</strong>になります。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading">多重性の回避方法2：閉手順（検定に順番を付ける）</h3>



<p>これは、閉手順という用語として知られる手法です。</p>



<p>複数回検定をする場合であっても、そこに順番を付けることで多重性を回避することが出来ます。</p>



<p>具体的には、このような手順です。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<div class="simple-box1">
<p>1番目の検定を実施し、有意であった場合に次の検定に移ります。</p>
<p>&#x2b07;︎</p>
<p>もし有意でない場合には、それ以降の検定は実施しません。</p>
<p>&#x2b07;︎</p>
<p>そして、2番目の検定を実施して、有意であった場合に次の検定に移ります。</p>
<p>&#x2b07;︎</p>
<p>もし有意でない場合には、それ以降の検定は実施しません。これを繰り返していくということです。</p>
</div>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>この方法によってなぜ多重性の問題が回避できるのか。</p>



<p>それは、「いずれかが有意である」という状況を避けることができるからです。</p>



<p>多重性の問題とは、複数回検定をする、ということ自体に問題があるわけではありません。</p>



<p><strong>複数回検定をして、どれか一つが有意になればOKという状況にある、ということが問題</strong>です。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>そのため、「いずれかが有意である」という状況を避けることができるこの「検定に順番をつける」というのは多重性の問題の回避につながるのです。</p>



<p>そして、ここも重要なのですが、この検定の順番というのも、事前に決める必要があることに注意しなければなりません。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading">多重性の回避方法3：有意水準を調整する</h3>



<p>これは最終的な手段になります。</p>



<p>どうしても複数回の検定を実施し、いずれかの結果によって試験の目的を達成することを言いたい場合、有意水準を調整する必要があります。</p>



<p>例えば<a href="https://best-biostatistics.com/multiple/bonferroni.html" target="_blank" rel="noopener noreferrer">ボンフェローニ法の場合、2回の検定を実施するのであれば、通常は5%にしている有意水準を2.5%にして2回検定を実施します</a>。</p>



<p>その場合には、P値は0.025を下回らなければ有意という結論は出せなくなります。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">多重性の調整方法まとめ</h2>



<p>医薬研究で多重性の問題が発生する状況として3つ例をあげました。</p>



<ol class="wp-block-list">
<li><strong><span style="font-size: 16px;">主要エンドポイントが2つ以上ある場合</span></strong></li>



<li><strong><span style="font-size: 16px;">比較する群が複数ある場合</span></strong></li>



<li><strong><span style="font-size: 16px;">解析する時点が複数ある場合</span></strong></li>
</ol>



<p>よく行われる多重性の回避方法も3つあります。</p>



<ol class="wp-block-list">
<li><strong>検定をどうにかして一つにする</strong></li>



<li><strong>検定に順番を付ける</strong></li>



<li><strong>有意水準を調整する</strong></li>
</ol>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p class="border1">ただし、複数回の検定が発生したら必ず多重性の調整をしなければならないかといえば、実はそうではない状況もあります。</p>



<p><a href="https://best-biostatistics.com/what_is_clinicaltrial/tansaku-kenshou.html" data-type="post" data-id="5958">研究自体が探索的</a>であれば多重性の問題はあると認識しつつ、多重性の調整は実施しない、という選択肢もあります。</p>



<p class="border1">その場合のP値は、<a href="https://best-biostatistics.com/review/nominal-pvalue.html" data-type="post" data-id="6953">名目上のP値</a>になりますので、取り扱いには注意しましょう。</p>




]]></content:encoded>
					
					<wfw:commentRss>https://best-biostatistics.com/multiple/avoid.html/feed</wfw:commentRss>
			<slash:comments>6</slash:comments>
		
		
			</item>
		<item>
		<title>ボンフェローニ法での補正は多重比較検定で重要！計算方法やメリットデメリット</title>
		<link>https://best-biostatistics.com/multiple/bonferroni.html</link>
					<comments>https://best-biostatistics.com/multiple/bonferroni.html#comments</comments>
		
		<dc:creator><![CDATA[beat1115]]></dc:creator>
		<pubDate>Tue, 17 Jun 2025 23:00:58 +0000</pubDate>
				<category><![CDATA[統計学的検定における、多重性の問題とは？]]></category>
		<category><![CDATA[P値]]></category>
		<category><![CDATA[多重性]]></category>
		<category><![CDATA[統計学的検定]]></category>
		<guid isPermaLink="false">http://best-biostatistics.com/wp/2016/02/07/bonferroni/</guid>

					<description><![CDATA[<p><img src="https://best-biostatistics.com/wp/wp-content/uploads/2016/02/スクリーンショット-2018-10-18-06.12.27.png" class="webfeedsFeaturedVisual" /></p>多重性という言葉を聞いたことがありますか？知っている方も、どうすればそれを回避できるか知っていますか？色々と知っていることが武器になりますよ。
]]></description>
										<content:encoded><![CDATA[<p><img src="https://best-biostatistics.com/wp/wp-content/uploads/2016/02/スクリーンショット-2018-10-18-06.12.27.png" class="webfeedsFeaturedVisual" /></p>
<p>この記事では、ボンフェローニ法（Bonferroni法）による統計学的検定の多重比較でどのような計算をしたらいいのか、そしてメリットやデメリットをお伝えします。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>統計学的検定では、様々な場面で多重性の問題が発生します。</p>



<p>臨床試験の場合にも例に漏れず、多重性の問題は統計担当者が一番頭を悩ませる問題。</p>



<p><a href="https://best-biostatistics.com/multiple/alpha.html" target="_blank" rel="noopener noreferrer">多重比較をすると問題なのが、全体的なαエラーが増大する</a>ということ。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p><a href="https://best-biostatistics.com/multiple/avoid.html" target="_blank" rel="noopener noreferrer">αエラーの増大を防ぐために、対処する方法は3つ</a>あります。</p>



<p>このページでは、その対処法の中で３つ目の「有意水準を補正する」方法を紹介します。</p>



<p>最も有名なのがボンフェローニ法（Bonferroni法）と呼ばれる補正方法です。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">ボンフェローニ法とは？統計検定で多重比較の際に有意水準を補正する方法</h2>


<div class="wp-block-image">
<figure class="aligncenter"><img decoding="async" width="640" height="345" src="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/987eca87017b5f2fa265f89558d4724a_s-e1577496841202.jpg" alt="" class="wp-image-2530" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/987eca87017b5f2fa265f89558d4724a_s-e1577496841202.jpg 640w, https://best-biostatistics.com/wp/wp-content/uploads/2019/10/987eca87017b5f2fa265f89558d4724a_s-e1577496841202-300x162.jpg 300w" sizes="(max-width: 640px) 100vw, 640px" /></figure>
</div>


<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p><a href="https://best-biostatistics.com/multiple/avoid.html" target="_blank" rel="noopener noreferrer">検定の多重性を回避する方法</a>として、有意水準を補正する方法がありました。</p>



<p>どんな場面で<a href="https://best-biostatistics.com/hypo_test/significant.html" target="_blank" rel="noopener noreferrer">有意水準</a>を補正するか。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<div class="boldBox ep-box es-BpaperRight es-grid bgc-VPsky">
<p><span style="text-decoration: underline; color: #000000;"><strong>検定を一つにも絞れず、かつ検定の優先順位（順番）もつけることができない場合</strong></span></p>
</div>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>そんな場面であれば、<a href="https://best-biostatistics.com/hypo_test/significant.html" target="_blank" rel="noopener noreferrer">有意水準</a>を調整する方法にします。</p>



<p>つまり、最終手段の方法ですね。</p>



<figure class="wp-block-image"><img decoding="async" width="657" height="502" src="https://best-biostatistics.com/wp/wp-content/uploads/2016/02/スクリーンショット-2018-12-27-13.44.47.png" alt="" class="wp-image-648" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2016/02/スクリーンショット-2018-12-27-13.44.47.png 657w, https://best-biostatistics.com/wp/wp-content/uploads/2016/02/スクリーンショット-2018-12-27-13.44.47-300x229.png 300w, https://best-biostatistics.com/wp/wp-content/uploads/2016/02/スクリーンショット-2018-12-27-13.44.47-375x287.png 375w" sizes="(max-width: 657px) 100vw, 657px" /></figure>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>ではなぜ、検定を1つに絞ったり、優先順位をつけたりする方法を優先して使ったほうがいいのか。</p>



<p>その理由は、明確なメリットがあるからです。</p>



<p>検定を1つに絞ったり、優先順位をつけたりする方法のメリット。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<div class="boldBox ep-box es-Bicon icon-tag bgc-VPorange">
<p><span style="text-decoration: underline; color: #000000;"><strong>有意水準を５％にしたまま検定できる</strong></span></p>
</div>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>だから、最初は検定を1つに絞ったり、優先順位をつけたりする方法を検討したほうがいいのです。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>では、どうしようもなく検定を複数回実施しなければならない場合。</p>



<p>有意水準を補正します。</p>



<p>そして有意水準を調整する方法がいくつか開発されています。</p>



<p>具体的にはボンフェローニ（Bonferroni）法、ホルム（Holm）法、そして多重比較検定である<a href="https://best-biostatistics.com/multiple/dunnett.html">ダネット（Dunnett）検定</a>や<a href="https://best-biostatistics.com/multiple/tukey.html">テューキー（Tukey）検定</a>などです。</p>



<p>今回の記事では、直感的かつ数学的にもイメージしやすいボンフェローニ法を紹介します。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">ボンフェローニ法で有意水準を補正する場合、どんな計算式なのか</h2>


<div class="wp-block-image">
<figure class="aligncenter"><img decoding="async" width="640" height="350" src="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/f3ff2b38f21bcd8da977db80ed2a0e7e_s-e1577089044626.jpg" alt="" class="wp-image-2531" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/f3ff2b38f21bcd8da977db80ed2a0e7e_s-e1577089044626.jpg 640w, https://best-biostatistics.com/wp/wp-content/uploads/2019/10/f3ff2b38f21bcd8da977db80ed2a0e7e_s-e1577089044626-300x164.jpg 300w" sizes="(max-width: 640px) 100vw, 640px" /></figure>
</div>


<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>ボンフェローニ法の有意水準の補正方法は簡単です。</p>



<p>通常の有意水準をα（普通は0.05）、実施する検定の数をNとする場合に、一つ一つの検定の有意水準を<span style="text-decoration: underline; font-size: 20px; color: #ff0000;"><strong>α/N</strong></span>にするという方法です。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>例えば、有意水準が0.05で、検定を２回実施したい時。</p>



<p>それぞれの検定の有意水準を<span class="marker-thickYellow"><strong>0.05/2=0.025</strong></span>に調整するのです。</p>



<p>そして検定の結果、<strong>P値が0.025を下回れば、有意</strong>になります。</p>



<p>決して、<strong>0.05を下回ったからといって、有意にはならない</strong>ので注意してください！</p>



<p>重要なのでもう一度書きます。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<div class="boldBox ep-box es-Bicon icon-tag bgc-VPorange">
<p><strong>検定を２回実施した場合、Bonferroni法で有意水準を調整して検定したら、P値が0.025を下回って初めて有意になる</strong></p>
</div>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>では、検定が５つの場合は。</p>



<p>一つ一つの検定の有意水準を0.05/5=0.01にして、P値が0.01を下回る場合に有意という結論を得ます。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>つまり、このようになりますね。</p>



<figure class="wp-block-image"><img decoding="async" width="495" height="371" src="https://best-biostatistics.com/wp/wp-content/uploads/2016/02/スクリーンショット-2018-12-27-13.48.46.png" alt="" class="wp-image-649" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2016/02/スクリーンショット-2018-12-27-13.48.46.png 495w, https://best-biostatistics.com/wp/wp-content/uploads/2016/02/スクリーンショット-2018-12-27-13.48.46-300x225.png 300w, https://best-biostatistics.com/wp/wp-content/uploads/2016/02/スクリーンショット-2018-12-27-13.48.46-375x281.png 375w" sizes="(max-width: 495px) 100vw, 495px" /></figure>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>この方法はとても直観的であり、かつ簡単に実施しやすい方法ではあります。</p>



<p>ですが、他の有意水準の調整方法よりも一番厳しい、つまり一番有意になりにくい方法であるといえます。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading">ボンフェローニ法などを使って有意水準を補正するとなぜαエラーが増大しないのか？</h3>



<p>ボンフェローニ法で有意水準を補正する計算式はわかりました。</p>



<p>αエラーを検定の回数で割るだけなので、特に難しくありませんでしたね。</p>



<p>では、なぜそのような有意水準の補正をするだけで、αエラーの増大が防げるのか？ということです。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>以下の図のように、1回だけ検定をした場合、αエラーは全体（100%）の中で5%を占めます。</p>



<figure class="wp-block-image"><img decoding="async" width="883" height="452" src="https://best-biostatistics.com/wp/wp-content/uploads/2016/02/alpha1.png" alt="" class="wp-image-1423" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2016/02/alpha1.png 883w, https://best-biostatistics.com/wp/wp-content/uploads/2016/02/alpha1-300x154.png 300w, https://best-biostatistics.com/wp/wp-content/uploads/2016/02/alpha1-768x393.png 768w, https://best-biostatistics.com/wp/wp-content/uploads/2016/02/alpha1-375x192.png 375w" sizes="(max-width: 883px) 100vw, 883px" /></figure>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>では、2回検定をした場合にはどうなるでしょうか。</p>



<p>その場合にαエラーは以下のようになります。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<figure class="wp-block-image"><img decoding="async" width="883" height="462" src="https://best-biostatistics.com/wp/wp-content/uploads/2016/02/alpha2.png" alt="" class="wp-image-1424" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2016/02/alpha2.png 883w, https://best-biostatistics.com/wp/wp-content/uploads/2016/02/alpha2-300x157.png 300w, https://best-biostatistics.com/wp/wp-content/uploads/2016/02/alpha2-768x402.png 768w, https://best-biostatistics.com/wp/wp-content/uploads/2016/02/alpha2-375x196.png 375w" sizes="(max-width: 883px) 100vw, 883px" /></figure>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>1回目のαエラーと2回目のαエラーがあり、その一部が重なっているような図です。</p>



<p>このとき、2回検定をして1回でもαエラーが生じる確率は、2つの円の総面積になります。</p>



<p>つまり、このときのαエラー「0.05+0.05-0.05*0.05=0.0975」となってしまうのです。</p>



<p>0.0975は有意水準で設定した0.05より大きいため、問題となります。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>しかし、ボンフェローニ法で有意水準を補正してあげると、1つ1つのアルファエラーが0.025になるため、以下のような図になります。</p>



<figure class="wp-block-image"><img decoding="async" width="814" height="401" src="https://best-biostatistics.com/wp/wp-content/uploads/2016/02/screenshot-2019-05-17-17.22.36.png" alt="" class="wp-image-1425" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2016/02/screenshot-2019-05-17-17.22.36.png 814w, https://best-biostatistics.com/wp/wp-content/uploads/2016/02/screenshot-2019-05-17-17.22.36-300x148.png 300w, https://best-biostatistics.com/wp/wp-content/uploads/2016/02/screenshot-2019-05-17-17.22.36-768x378.png 768w, https://best-biostatistics.com/wp/wp-content/uploads/2016/02/screenshot-2019-05-17-17.22.36-375x185.png 375w" sizes="(max-width: 814px) 100vw, 814px" /></figure>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>そのため、2回検定をして1回でもαエラーが生じる確率は、2つの円の総面積の0.049375<span style="font-family: Lato, 游ゴシック体, 'Yu Gothic', YuGothic, 'ヒラギノ角ゴシック Pro', 'Hiragino Kaku Gothic Pro', メイリオ, Meiryo, 'ＭＳ Ｐゴシック', 'MS PGothic', sans-serif; font-size: 1.4rem;">となります。</span></p>



<p>そうすると、有意水準である0.05よりも小さいαエラーで2回の検定をすることができることになります。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">ボンフェローニ法で有意水準を補正するデメリット</h2>


<div class="wp-block-image">
<figure class="aligncenter"><img decoding="async" width="640" height="427" src="https://best-biostatistics.com/wp/wp-content/uploads/2019/11/a1da5ef0ce44877f9b66d512f4762577_s.jpg" alt="" class="wp-image-2487" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2019/11/a1da5ef0ce44877f9b66d512f4762577_s.jpg 640w, https://best-biostatistics.com/wp/wp-content/uploads/2019/11/a1da5ef0ce44877f9b66d512f4762577_s-300x200.jpg 300w" sizes="(max-width: 640px) 100vw, 640px" /></figure>
</div>


<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>計算が簡単で、直感的に理解しやすいボンフェローニ法。</p>



<p>しかし、この方法には問題点があります。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>それは<a href="https://best-biostatistics.com/hypo_test/error.html" target="_blank" rel="noopener noreferrer"><strong>検出力が低くなってしまう</strong></a>こと。</p>



<p><span style="text-decoration: underline;"><strong>検出力が低いということは、本来であれば有意差が出るはずのデータなのに有意差が付きにくい、ということ</strong></span>です。</p>



<p>統計的な用語を使うと「保守的な」検定方法です。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>なぜならば、本当は有意水準を0.05として設定していいですが、前述の通り2回検定した場合に0.049375のαエラーになります。</p>



<p>0.05-0.04375=0.00625だけ、有意差が付きにくくなっている、ということ。</p>



<p>ほんのちょっとの違いのように思いますが、この数字の差はかなり大きいのです。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>この保守的な側面を解決するために、ホルム（Holm）法や多重比較検定である<a href="https://best-biostatistics.com/multiple/dunnett.html">ダネット（Dunnett）検定</a>や<a href="https://best-biostatistics.com/multiple/tukey.html">テューキー（Tukey）検定</a>などが開発されました。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">ボンフェローニ法に関するまとめ</h2>


<div class="wp-block-image">
<figure class="aligncenter"><img decoding="async" width="640" height="344" src="https://best-biostatistics.com/wp/wp-content/uploads/2019/11/53e0d72ad9bae4b1e39c3b1c6bf377dd_s-e1573554634921.jpg" alt="" class="wp-image-2320" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2019/11/53e0d72ad9bae4b1e39c3b1c6bf377dd_s-e1573554634921.jpg 640w, https://best-biostatistics.com/wp/wp-content/uploads/2019/11/53e0d72ad9bae4b1e39c3b1c6bf377dd_s-e1573554634921-300x161.jpg 300w" sizes="(max-width: 640px) 100vw, 640px" /></figure>
</div>


<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>多重性の対処法の中で、有意水準を調整する方法は、最後に選択する最終手段。</p>



<p>Bonferroni法は直感的で、簡単に実施しやすい調整方法。</p>



<p>しかし、他の調整法と比べて有意になりにくい、保守的な方法とも言える。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>Bonferroni法は<a href="https://best-biostatistics.com/hypo_test/post_hoc_test.html" data-type="post" data-id="5816">分散分析の後の事後検定</a>としても使われることがあります。</p>



<p>動画でも多重性の問題とボンフェローニ法の解説をしていますので、記事内容と合わせてご確認いただけると理解が進むかと思います。</p>



<p class="has-text-align-center"><iframe width="560" height="315" src="https://www.youtube.com/embed/vXg3R6fxZSs" frameborder="0" allowfullscreen="allowfullscreen" data-mce-fragment="1"></iframe></p>
]]></content:encoded>
					
					<wfw:commentRss>https://best-biostatistics.com/multiple/bonferroni.html/feed</wfw:commentRss>
			<slash:comments>5</slash:comments>
		
		
			</item>
		<item>
		<title>サンプルサイズの決め方は？臨床研究で統計的な検出力を保持する計算式</title>
		<link>https://best-biostatistics.com/hypo_test/num-subject.html</link>
					<comments>https://best-biostatistics.com/hypo_test/num-subject.html#comments</comments>
		
		<dc:creator><![CDATA[beat1115]]></dc:creator>
		<pubDate>Mon, 24 Feb 2025 23:00:43 +0000</pubDate>
				<category><![CDATA[統計学的検定の基礎]]></category>
		<category><![CDATA[0.05]]></category>
		<category><![CDATA[P値]]></category>
		<category><![CDATA[有意水準]]></category>
		<category><![CDATA[統計学的検定]]></category>
		<guid isPermaLink="false">http://best-biostatistics.com/wp/2016/02/07/num-subject/</guid>

					<description><![CDATA[<p><img src="https://best-biostatistics.com/wp/wp-content/uploads/2016/02/screenshot-2019-05-07-1.35.49.png" class="webfeedsFeaturedVisual" /></p>検定とは何でしょうか？P値と有意水準の違いは？結果が良ければそれは真実？
検定の便利な点と、安易に検定をする怖さを解説します。
]]></description>
										<content:encoded><![CDATA[<p><img src="https://best-biostatistics.com/wp/wp-content/uploads/2016/02/screenshot-2019-05-07-1.35.49.png" class="webfeedsFeaturedVisual" /></p>
<p>突然ですが、臨床研究での<span style="color: #ff0000;"><strong>サンプルサイズの決め方を知っていますか？</strong></span></p>



<p>統計学的検定をする際にとても重要なこと。</p>



<p>それが、<strong>サンプルサイズを事前に決めること</strong>です。</p>



<p>なぜかというと、統計学的検定とは、事前に<a href="https://best-biostatistics.com/hypo_test/power.html">検出力</a>を保った上で検定する必要があるから。</p>



<p>そうでなければ、<strong>いくら<a href="https://best-biostatistics.com/hypo_test/significant.html">P値が0.05を下回ったところで、有意差が出たというその結果は「たまたま」にしか過ぎない</a></strong>からです。</p>



<p>今回の記事では、なぜサンプルサイズを決めなければならないのか、そして、サンプルサイズを決めるには何を意識すれば良いのか、論文の書き方についてお伝えします。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">臨床研究でのサンプルサイズの決め方は？なぜ必要症例数は事前に決めなければならないの？</h2>


<div class="wp-block-image">
<figure class="aligncenter"><img decoding="async" width="640" height="323" src="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/7f418be16ff229275d0670150ea529e0_s-e1577088780405.jpg" alt="サンプルサイズの決め方は？なぜ必要症例数は事前に決めなければならないの？" class="wp-image-2528" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/7f418be16ff229275d0670150ea529e0_s-e1577088780405.jpg 640w, https://best-biostatistics.com/wp/wp-content/uploads/2019/10/7f418be16ff229275d0670150ea529e0_s-e1577088780405-300x151.jpg 300w" sizes="(max-width: 640px) 100vw, 640px" /></figure>
</div>


<p>サンプルサイズは、事前に決める必要があることをお伝えしました。</p>



<p>しかし、<span style="color: #ff0000;"><strong>なぜ事前に決めなければならないのか？という疑問が出てきます</strong></span>よね。</p>



<p>そのために、T検定を例にしてなぜ事前に決めなければならないのかを解説します。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading">サンプルサイズが大きいとP値が小さくなる：T検定を例にして計算式を理解する</h3>



<p><a href="https://best-biostatistics.com/stat-test/t-test.html" target="_blank" rel="noopener noreferrer">T検定でやっていること</a>は、以下の4つの手順です。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<ol class="wp-block-list">
<li><strong>プラセボ群や実薬群の平均値、標準偏差を算出する</strong></li>



<li><strong>T統計量を算出する</strong></li>



<li><strong>P値を算出する（T統計量が大きいと、P値は小さくなる）</strong></li>



<li><strong><a href="https://best-biostatistics.com/hypo_test/significant.html" target="_blank" rel="noopener noreferrer">P値が有意水準（α=0.05）を下回っているかどうかを判断</a>する</strong></li>
</ol>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>この時、T統計量がどんな計算式で求められるかを確認してみます。</p>



<p>T統計量とは、以下の式です。（Nがサンプルサイズ、SDが標準偏差を示しています）</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>


<div class="wp-block-image">
<figure class="aligncenter"><img decoding="async" width="414" height="107" src="https://best-biostatistics.com/wp/wp-content/uploads/2016/02/スクリーンショット-2019-05-07-00.42.15.png" alt="サンプルサイズの計算式" class="wp-image-1383" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2016/02/スクリーンショット-2019-05-07-00.42.15.png 414w, https://best-biostatistics.com/wp/wp-content/uploads/2016/02/スクリーンショット-2019-05-07-00.42.15-300x78.png 300w, https://best-biostatistics.com/wp/wp-content/uploads/2016/02/スクリーンショット-2019-05-07-00.42.15-375x97.png 375w" sizes="(max-width: 414px) 100vw, 414px" /></figure>
</div>


<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>この時、プラセボ群のSDと被験薬群のSDが同じと仮定し、式展開してみます。</p>



<p>すると、以下のような式になります。</p>


<div class="wp-block-image">
<figure class="aligncenter"><img decoding="async" width="701" height="118" src="https://best-biostatistics.com/wp/wp-content/uploads/2016/02/スクリーンショット-2019-05-07-00.44.46.png" alt="サンプルサイズの計算式" class="wp-image-1385" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2016/02/スクリーンショット-2019-05-07-00.44.46.png 701w, https://best-biostatistics.com/wp/wp-content/uploads/2016/02/スクリーンショット-2019-05-07-00.44.46-300x50.png 300w, https://best-biostatistics.com/wp/wp-content/uploads/2016/02/スクリーンショット-2019-05-07-00.44.46-375x63.png 375w" sizes="(max-width: 701px) 100vw, 701px" /></figure>
</div>


<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>この式を見ると、3つのことに気づきます。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<ol class="wp-block-list">
<li><strong>サンプルサイズ（N）を大きくすると、<a href="https://best-biostatistics.com/stat-test/toukeiryou.html">T統計量</a>が大きくなる（つまり、P値が小さくなる）</strong></li>



<li><strong>群間の差が大きいと、T統計量が大きくなる（つまり、P値が小さくなる）</strong></li>



<li><strong>標準偏差（SD）が小さいと、T統計量が大きくなる（つまり、P値が小さくなる）</strong></li>
</ol>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>そう、P値が小さくなる要素は、群間の差が大きいだけじゃないんです。</p>



<p><span class="marker"><strong>サンプルサイズが大きくても、P値は小さくなります</strong></span>。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading">サンプルサイズを事前に決めないとなぜP値が小さくなったかわからなくなる</h3>



<p>そのため、サンプルサイズを事前に決めなかった場合に、有意差が出た時。</p>



<p>2つの解釈ができることになります。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<ol class="wp-block-list">
<li><strong>群間の差が大きくてP値が小さくなった可能性</strong></li>



<li><strong>サンプルサイズが大きくてP値が小さくなった可能性</strong></li>
</ol>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p><strong>私たちが得たいのは、1の「群間の差が大きくてP値が小さくなった」という結果</strong>です。</p>



<p>しかしながら、<span style="color: #ff0000;"><strong>サンプルサイズを事前に決めておかないと、P値が小さくなった要因が「群間差がある」と「サンプルサイズが大きい」の2つの可能性が残ってしまうことになってしまう</strong></span>のです。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>そのため、サンプルサイズを事前に決める理由をまとめます。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<div class="ep-box es-BsubTradi bgc-white es-borderSolidM es-radius brc-DPred" title="サンプルサイズを事前に決める理由"><span style="font-size: 14pt;"><strong>P値が小さくなった時に、「群間差があってP値が小さくなった」のか「サンプルサイズが大きいためにP値が小さくなったのか」の2つの可能性が残ってしまうため</strong></span></div>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>これはぜひ理解してください。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">サンプルサイズの決め方は？検出力を確保するために考えること</h2>


<div class="wp-block-image">
<figure class="aligncenter"><img decoding="async" width="640" height="340" src="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/2ae4ec48eb55ae189560e8bb40caa89f_s-e1577089193118.jpg" alt="サンプルサイズの決め方は？検出力を確保するために考えること" class="wp-image-2529" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/2ae4ec48eb55ae189560e8bb40caa89f_s-e1577089193118.jpg 640w, https://best-biostatistics.com/wp/wp-content/uploads/2019/10/2ae4ec48eb55ae189560e8bb40caa89f_s-e1577089193118-300x159.jpg 300w" sizes="(max-width: 640px) 100vw, 640px" /></figure>
</div>


<p>サンプルサイズを事前に決めておく重要性を理解しました。</p>



<p>ということで、サンプルサイズの決め方です。</p>



<p>サンプルサイズを決めるためには、<span style="color: #ff0000;"><strong>4つを決める必要があります</strong></span>。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<ol class="wp-block-list">
<li><strong>群間の効果の差</strong></li>



<li><strong>ばらつき</strong></li>



<li><a href="https://best-biostatistics.com/hypo_test/error.html" target="_blank" rel="noopener noreferrer"><strong>αエラー</strong></a></li>



<li><a href="https://best-biostatistics.com/hypo_test/error.html" target="_blank" rel="noopener noreferrer"><strong>βエラー</strong></a></li>
</ol>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>逆にいうと、上記の4つを決めてしまえばサンプルサイズは自動で決まります。</p>



<p>そのため、この4つに症例数を加えた5つを五角形に見立てて、<strong>症例数を決めるペンタゴン</strong>という場合があります。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>


<div class="wp-block-image">
<figure class="aligncenter"><img decoding="async" width="525" height="296" src="https://best-biostatistics.com/wp/wp-content/uploads/2016/02/shoureisuu.png" alt="サンプルサイズの決め方は？検出力を確保するために考えること" class="wp-image-393" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2016/02/shoureisuu.png 525w, https://best-biostatistics.com/wp/wp-content/uploads/2016/02/shoureisuu-300x169.png 300w" sizes="(max-width: 525px) 100vw, 525px" /></figure>
</div>


<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading">サンプルサイズが変動する要因は？検出力を保つために</h3>



<p>群間の効果の差、ばらつき、αエラー、βエラーの4つを動かせば、サンプルサイズが変動することがわかりました。</p>



<p>では、各4つの要素をどう動かすと、サンプルサイズが多くなるか、を見てみます。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<figure class="wp-block-image"><img decoding="async" width="683" height="388" src="https://best-biostatistics.com/wp/wp-content/uploads/2016/02/screenshot-1.png" alt="サンプルサイズが変動する要因は？検出力を保つために" class="wp-image-1387" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2016/02/screenshot-1.png 683w, https://best-biostatistics.com/wp/wp-content/uploads/2016/02/screenshot-1-300x170.png 300w, https://best-biostatistics.com/wp/wp-content/uploads/2016/02/screenshot-1-375x213.png 375w" sizes="(max-width: 683px) 100vw, 683px" /></figure>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<ol class="wp-block-list">
<li><strong>群間の効果の差が小さいと、サンプルサイズは多くなる</strong></li>



<li><strong>ばらつきが大きいと、サンプルサイズは多くなる</strong></li>



<li><strong>αエラーが小さいと、サンプルサイズは多くなる</strong></li>



<li><strong>βエラーが小さい（<a href="https://best-biostatistics.com/hypo_test/power.html">検出力</a>が大きい）と、サンプルサイズは多くなる</strong></li>
</ol>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>このような動きになります。</p>



<p>上記の4つの動きに関しては、絶対に覚えておきましょう。</p>



<p>丸暗記でもいいぐらいです。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>ちなみに、βエラーに関しては、検出力で表現する場合があります。</p>



<p><strong>検出力とは（1-βエラー）で表現できるため、βエラーが小さいというのは、検出力が大きい、と等しいことです</strong>。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading">サンプルサイズの決め方は、薬の開発状況によって変わる</h3>



<p>サンプルサイズを決めるのは、群間の効果の差、ばらつき、αエラー、βエラーの4つでした。</p>



<p>そして、それぞれが変化すると、サンプルサイズが大きくなったり小さくなったりします。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>では、開発費用や開発期間が限られた中で、サンプルサイズをできるだけ小さくするには、どこをどうすれば良いでしょうか？</p>



<p>それは、その<strong>薬の開発状況に応じて変化させる必要があります</strong>。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p><a href="https://best-biostatistics.com/biostat/piii.html" target="_blank" rel="noopener noreferrer">第III相試験であれば、αエラーは5%以下にしなければならないと明確に決まっているため、αエラーを変えることが出来ません</a>。</p>



<p>しかし<a href="https://best-biostatistics.com/biostat/piii.html" target="_blank" rel="noopener noreferrer">第II相試験であれば、企業リスクを受け入れる形で、αエラーを10%にしてみることも可能</a>です。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>ですがやはり一番に考えるのは、薬効の効果の差と、そのばらつきを変えることが出来ないか？ということです。</p>



<p><strong>薬効の効果の差を大きくするためには、試験に組み入れる患者を、薬剤が効く集団に限定するように、組み入れ基準や除外基準を決める</strong>ということを考えます。</p>



<p>しかし、薬が効く集団だけで試験をするとなると、<a href="https://best-biostatistics.com/biostat/boshuudan.html" target="_blank" rel="noopener noreferrer">母集団がどこになるのか</a>、そして<a href="https://best-biostatistics.com/design/ippannka.html" target="_blank" rel="noopener noreferrer">一般化可能性を考える必要があります</a>。</p>



<p>そうして限定された集団で試験をすると、薬として発売されたとしても投与できる集団が限定されて、結局売り上げが伸びないといったことにつながる可能性が出てきます。</p>



<p>このように、開発コストの面と、一般化可能性の面を天秤に掛けて、常に試験の集団を考えなければいけません。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">論文にもサンプルサイズをMethodに記載する。書き方は？</h2>



<p>サンプルサイズが事前に決まっているかどうか、<a href="https://best-biostatistics.com/review/publication-read.html">論文ではMethodを読む</a>ことで確認することが出来ます。</p>



<p>ここでサンプルサイズのことが書いていない論文については、どれだけ素晴らしい結果（P値が小さい結果）であろうと、たまたま出た結果であることが否定できません。</p>



<p>つまり、その試験をもう一度実施したら、全く違った結果が出る可能性があるということです。</p>



<p>なぜなら、前述の通り、<span class="marker">本当に薬に効果があったためにP値が小さくなったのか、サンプルサイズが大きかったためにP値が小さくなったのかが分からないためです</span>。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>そして、あなたの研究でもサンプルサイズを記載する必要があります。</p>



<p>サンプルサイズの論文への書き方に関しては、他の論文を参考にすることでOK。</p>



<p>例えば、こちらの論文を見てみます。</p>



<figure class="wp-block-image size-full is-resized"><img decoding="async" width="870" height="416" src="https://best-biostatistics.com/wp/wp-content/uploads/2022/03/ScreenShot-2025-02-25-7.50.17.png" alt="" class="wp-image-7951" style="width:852px;height:auto" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2022/03/ScreenShot-2025-02-25-7.50.17.png 870w, https://best-biostatistics.com/wp/wp-content/uploads/2022/03/ScreenShot-2025-02-25-7.50.17-300x143.png 300w, https://best-biostatistics.com/wp/wp-content/uploads/2022/03/ScreenShot-2025-02-25-7.50.17-768x367.png 768w" sizes="(max-width: 870px) 100vw, 870px" /></figure>



<p class="has-text-align-right"><strong><a href="DOI: 10.1056/NEJMoa2203094">DOI: 10.1056/NEJMoa2203094</a></strong></p>



<p>Methodを見ると、下記のようなサンプルサイズ計算の記載があります。</p>



<p class="has-border -border01">We estimated that 25% of the patients in the acetazolamide group would have successful decongestion within 3 days after randomization; 25% was chosen to represent a clear, meaningful absolute benefit of 10 percentage points as compared with placebo. Assuming a two-sided alpha of 0.05 and a statistical power of 80%, we calculated the targeted sample size for the trial to be 494, and to account for a potential withdrawal of 5% of the patients, we calculated that the trial would need to enroll 519 patients.</p>



<p>サンプルサイズ計算をしていれば、その通りに記載すればいいのですが、<a href="https://best-biostatistics.com/what_is_clinicaltrial/tansaku-kenshou.html" data-type="post" data-id="5958">探索的な研究</a>の場合には事前にサンプルサイズ計算をしていない場合もあるはず。</p>



<p>事前にサンプルサイズ計算をしていない場合でも、Methodにはその旨を記載します。</p>



<p>例えばこちらの論文を参考にしてみます。</p>



<figure class="wp-block-image size-full"><img decoding="async" width="674" height="260" src="https://best-biostatistics.com/wp/wp-content/uploads/2022/03/ScreenShot-2025-02-25-7.55.16.png" alt="" class="wp-image-7952" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2022/03/ScreenShot-2025-02-25-7.55.16.png 674w, https://best-biostatistics.com/wp/wp-content/uploads/2022/03/ScreenShot-2025-02-25-7.55.16-300x116.png 300w" sizes="(max-width: 674px) 100vw, 674px" /></figure>



<p class="has-text-align-right"><a href="https://doi.org/10.1111/bjd.14207">https://doi.org/10.1111/bjd.14207</a></p>



<p>Methodを見ると、下記のようなサンプルサイズ計算の記載があります。</p>



<p class="has-border -border01">No statistical sample size calculations were conducted. However, a sample size of nine patients per group gave post hoc powers of 43%, 40% and 31% to detect differences in mean of 30%, 29% and 25%, respectively, for pruritus VAS score at week 4, assuming a common SD of 33%, using a two‐group <em>t</em>‐test with a two‐sided significance level of <em>P</em> &lt; 0·05 for percentage change from baseline between placebo and each active group.</p>



<p>最初に「No statistical sample size calculations were conducted.」と、潔く記載していることがわかります。</p>



<p>そして、事前にサンプルサイズ計算をしていない代わりに、<a href="https://best-biostatistics.com/hypo_test/power.html" data-type="post" data-id="5152">事後的な検出力</a>を計算して記載しています。</p>



<p>このような書き方もOKです。</p>



<p>＞＞<a href="https://best-biostatistics.com/ezr/ezr-power.html" data-type="post" data-id="5139">EZRで検出力計算をするには？</a></p>



<h3 class="wp-block-heading">サンプルサイズの重要性：統計的に有意な差と、臨床的に意味のある差は違うことを理解する</h3>



<p>サンプルサイズが大きくなると、P値が小さくなることを学びました。</p>



<p>この事実を知っていると、<strong>「統計的に有意な差」と「臨床的に意味のある差」は異なる</strong>ということがわかります。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>私は豊富な資金と期間があれば、どんなデータにでも有意な差を付けることが出来ます。</p>



<p>例えば、東京都の20歳と神奈川県の20歳の収縮期血圧に有意な差をつけることも可能です。</p>



<p>それが例え1mmHgの差であったとしてもです。</p>



<p>1万人ずつ被験者さんがいれば、1mmHgの差で統計的な有意差を付けることが出来ます。</p>



<p>でも、考えてみてください。収縮期血圧の1mmHgの差は、臨床的にどれだけ意味のある差でしょうか？</p>



<p>同じ人でも血圧を2回測定したら、それだけで1mmHgの違いなんて簡単に出てきます。</p>



<p>まったく臨床的に意味はない差ですよね。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>そのため臨床研究を行う私たちが気にしなければいけないことは、<strong><span style="color: #ff0a0a;">臨床的に意味のある差を統計学的に検出できているのか？</span></strong>ということです。</p>



<p>この視点がない限り、統計は単なる数値のお遊びでしかなくなります。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>ぜひ論文を読む際にも、<strong><span class="marker">統計学的に差がつけられたこの数値は、臨床的に意味のある差なのか？</span></strong>という観点で読んでみてください。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">サンプルサイズに関するまとめ</h2>


<div class="wp-block-image">
<figure class="aligncenter"><img decoding="async" width="640" height="334" src="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/ec17114ba3d7d829dcd97f397b8c1421_s-e1577088691586.jpg" alt="サンプルサイズに関するまとめ" class="wp-image-2527" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/ec17114ba3d7d829dcd97f397b8c1421_s-e1577088691586.jpg 640w, https://best-biostatistics.com/wp/wp-content/uploads/2019/10/ec17114ba3d7d829dcd97f397b8c1421_s-e1577088691586-300x157.jpg 300w" sizes="(max-width: 640px) 100vw, 640px" /></figure>
</div>


<p>統計的検定を厳密に実施するためには、事前にサンプルサイズを決める必要がある。</p>



<p>サンプルサイズを決めずに得た検定結果は、、本当に薬に効果があったためにP値が小さくなったのか、サンプルサイズが大きかったためにP値が小さくなったのかが分からない。</p>



<p>サンプルサイズを決めるのは、群間の効果の差、ばらつき、αエラー、βエラーの4つである。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>＞＞<a href="https://best-biostatistics.com/ezr/ezr-samplenum.html">EZRでサンプルサイズを計算する方法</a></p>



<p>＞＞<a href="https://best-biostatistics.com/jmp/jmp-sample-size.html">JMPでサンプルサイズを計算する方法</a></p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>統計に関するご質問があれば、メルマガにご登録の上ご質問くださいませ！</p>



<p>＞＞<a href="https://best-biostatistics.com/lp2/seo/">メルマガ登録はこちら（無料プレゼントあります。）</a></p>
]]></content:encoded>
					
					<wfw:commentRss>https://best-biostatistics.com/hypo_test/num-subject.html/feed</wfw:commentRss>
			<slash:comments>6</slash:comments>
		
		
			</item>
		<item>
		<title>検定の多重性とは？その意味と統計検定のp値を解釈する上で重要なこと</title>
		<link>https://best-biostatistics.com/multiple/alpha.html</link>
					<comments>https://best-biostatistics.com/multiple/alpha.html#comments</comments>
		
		<dc:creator><![CDATA[beat1115]]></dc:creator>
		<pubDate>Sun, 10 Nov 2024 23:00:07 +0000</pubDate>
				<category><![CDATA[統計学的検定における、多重性の問題とは？]]></category>
		<category><![CDATA[P値]]></category>
		<category><![CDATA[多重性]]></category>
		<category><![CDATA[統計学的検定]]></category>
		<guid isPermaLink="false">http://best-biostatistics.com/wp/2016/02/07/alpha/</guid>

					<description><![CDATA[<p><img src="https://best-biostatistics.com/wp/wp-content/uploads/2021/12/Youtubeアイキャッチ-1-1024x576.jpg" class="webfeedsFeaturedVisual" /></p>多重性という言葉を聞いたことがありますか？知っている方も、どうすればそれを回避できるか知っていますか？色々と知っていることが武器になりますよ。
]]></description>
										<content:encoded><![CDATA[<p><img src="https://best-biostatistics.com/wp/wp-content/uploads/2021/12/Youtubeアイキャッチ-1-1024x576.jpg" class="webfeedsFeaturedVisual" /></p>
<p>統計学的検定を学ぶと、必ず避けて通れない問題があります。</p>



<p>それが、検定の多重性。</p>



<p>臨床研究でも検定の多重性は重要な問題となります。</p>







<p>この記事では、統計学的検定で問題となる検定の多重性のについて解説します。</p>



<p>多重性の意味や、p値の解釈で注意しなければならないことがあるので、それを理解していきましょう。</p>











<h2 class="wp-block-heading">検定の多重性とは？統計学的検定を複数回実施することで起こる問題</h2>


<div class="wp-block-image">
<figure class="aligncenter"><img decoding="async" width="640" height="323" src="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/7f418be16ff229275d0670150ea529e0_s-e1577088780405.jpg" alt="" class="wp-image-2528" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/7f418be16ff229275d0670150ea529e0_s-e1577088780405.jpg 640w, https://best-biostatistics.com/wp/wp-content/uploads/2019/10/7f418be16ff229275d0670150ea529e0_s-e1577088780405-300x151.jpg 300w" sizes="(max-width: 640px) 100vw, 640px" /></figure>
</div>






<p>まずは、多重性とは何か、ということを理解しましょう。</p>



<p>多重性の問題を一言で表すと、こんな問題です。</p>







<p class="is-style-big_icon_hatena"><strong><span style="text-decoration: underline;">多重性の問題とは？：</span></strong><br>→<strong><span class="swl-marker mark_orange">検定を複数回実施すると、少なくとも一つ以上の検定結果が有意になる確率が増大する問題</span></strong></p>







<p>あまりピンとこないかもしれませんので、さいころを例に多重性を紐解いてみます。</p>







<h3 class="wp-block-heading">検定の多重性の意味を例でわかりやすく：サイコロで1回でも6が出る確率</h3>



<p>みなさんご存知の通り、サイコロは<strong><span class="marker">1〜6の目がそれぞれ1/6の確率で出る</span></strong>ようになっています。</p>



<p>では、６が出る確率を考えてみましょう。</p>



<p><span class="marker">1回さいころを投げて6が出る確率は、当然1/6≒17%</span>ですね。</p>







<p>次からが多重性の問題。</p>



<p>では、<strong><span class="marker">2回さいころ投げて「少なくとも1回6が出る確率」はどうなるでしょうか？</span></strong></p>



<p>あなたは答えられますか？</p>







<p>計算方法としては、<span style="color: #ff0000;"><strong>1-（１回も6が出ない確率）</strong></span>を求めればよいです。</p>



<p>すると、１回も６が出ない確率は６以外の目が出る確率なので、5/6です。</p>



<p>となると、<span class="marker">2回さいころ投げて「少なくとも1回6が出る確率」は、以下のように計算できます</span>。</p>



<p><span style="color: #ff0000;"><strong>1-5/6*5/6 = 11/36 ≒ 31%</strong></span></p>



<p>3回さいころを投げて「少なくとも1回6が出る確率」も、同様に計算してみます。</p>



<p><strong><span style="color: #ff0000;">1-5/6*5/6*5/6 ≒ 42%</span></strong></p>







<p>今までの計算を、表にまとめます。</p>



<figure class="wp-block-table"><table class="has-fixed-layout"><tbody><tr><td><strong>サイコロを投げる回数</strong></td><td><strong>少なくとも1回6の目が出る確率</strong></td></tr><tr><td>1回</td><td>17%</td></tr><tr><td>2回</td><td>31%</td></tr><tr><td>3回</td><td>42%</td></tr></tbody></table></figure>







<p>さいころを投げて6の目が出る確率は1/6でした。</p>



<p>しかし、複数回さいころを投げることで「一回でも6の目が出る確率」は1/6よりも大きくなってしまいました。</p>







<p>この概念が、統計学的検定の多重性の問題と同じなのです。</p>











<h2 class="wp-block-heading">統計学的検定の多重性を考える時には、検定の回数に注意</h2>


<div class="wp-block-image">
<figure class="aligncenter"><img decoding="async" width="640" height="350" src="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/f3ff2b38f21bcd8da977db80ed2a0e7e_s-e1577089044626.jpg" alt="" class="wp-image-2531" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/f3ff2b38f21bcd8da977db80ed2a0e7e_s-e1577089044626.jpg 640w, https://best-biostatistics.com/wp/wp-content/uploads/2019/10/f3ff2b38f21bcd8da977db80ed2a0e7e_s-e1577089044626-300x164.jpg 300w" sizes="(max-width: 640px) 100vw, 640px" /></figure>
</div>






<p>検定の多重性とは、さいころを複数回投げることと一緒です。</p>



<p>さいころの例のように、複数回の検定を実施することで<strong><span style="color: #ff0a0a;">「1回でもその結果が出る確率（検定であれば有意になる確率）」が増大してしまう</span></strong>という現象が起きます。</p>



<p>さいころの例を統計的検定に置き換えると、<strong><span style="color: #ff0a0a;">αエラーが1回の検定だと5%であったものが、複数回繰り返すと全体のαエラーが5%よりも大きくなってしまう</span></strong>ということになります。</p>







<p>例えば、検定を２回実施した場合。</p>



<p><span class="marker">「少なくとも1つが有意になる確率」</span>はどうなるでしょうか。</p>



<p>サイコロの例と同じように数式に表してみましょう。</p>



<p>計算方法としては、<span style="color: #ff0000;"><strong>1-（１回も有意にならない確率）</strong></span>を求めればよいですね。</p>



<p>ということは、<strong><span class="marker">1-0.95*0.95＝0.0975</span></strong>。</p>



<p>つまり、<strong><span class="marker">αエラーが9.75%になってしまう</span></strong>のです！</p>







<figure class="wp-block-table"><table class="has-fixed-layout"><tbody><tr><td><strong>検定を実施する回数</strong></td><td><strong>少なくとも1回は有意になる確率</strong></td></tr><tr><td>1回</td><td>5%</td></tr><tr><td>2回</td><td>9.75%</td></tr></tbody></table></figure>







<p>これは重大な問題ですね。</p>



<p><a href="https://best-biostatistics.com/hypo_test/error.html" target="_blank" rel="noopener noreferrer">αエラーが増大するということは、患者さんの不利益</a>につながります。</p>



<p>そのため、統計的検定は、1回だけ実施することが原則になります。</p>







<h3 class="wp-block-heading">検定の多重性が発生する時には、p値の解釈にも注意する</h3>



<p>検定の多重性が発生しているということは、<a href="https://best-biostatistics.com/hypo_test/error.html">αエラー</a>が増大しているということです。</p>



<p>そのため、p値の解釈にも注意が必要です。</p>



<p>通常は<a href="https://best-biostatistics.com/hypo_test/significant.html">有意水準</a>を0.05に設定している場合、多重性の問題がなければp値が0.05を下回っている場合に「有意である」と結論づけることになります。</p>







<p>しかし、多重性の問題が発生している場合には、有意になりやすくなっている状況なので、<strong>意図的に有意になりにくいように解釈をする必要がある</strong>のです。</p>



<p>そのため、例えば<a href="https://best-biostatistics.com/multiple/bonferroni.html" target="_blank" rel="noopener noreferrer">ボンフェローニ法のように検定を2回実施するのであれば、p値も0.025を下回らない限り有意とは言えない</a>、というように、厳しくp値を解釈する必要があるのです。</p>







<p>αエラーとβエラーをコントロールしていないp値は、名目上のp値として位置付けられます。</p>



<p>名目上のp値は<strong><span class="swl-marker mark_orange">「それ単独で解釈できないp値（つまり、0.05を下回ったかどうかで判断できないp値）」</span></strong>のため、特に解釈に注意が必要です。</p>



<p>＞＞<a href="https://best-biostatistics.com/review/nominal-pvalue.html" data-type="post" data-id="6953">名目上のp値とは？</a></p>







<h3 class="wp-block-heading">検定の多重性を補正するには、αエラーに着目する</h3>



<p>上記の通り多重性の本質は、<strong>複数回検定を実施することで<span class="marker">αエラーが増大してしまう</span></strong>、ということ。</p>



<p>ということは、<strong><span class="marker">実際には「複数回検定を実施する」こと自体が問題ではなく、「αエラーが増大してしまう」ということが問題</span></strong>です。</p>







<p>ということなので、<strong><span class="marker">たとえ複数回検定を実施することになっても、αエラーさえ増大しなければ、それはそれで複数回検定を実施してもOK</span></strong>ということです。</p>







<h3 class="wp-block-heading">多重性を回避しながら複数の検定を実施したいときにはどうすればよい？</h3>



<p>多重性によって検定結果が信頼のおけない結果になることは分かりました。</p>



<p>ただそれでも、複数の項目・複数の時点で検定を実施したい場合、どうすればよいでしょうか？</p>



<ol class="wp-block-list is-style-num_circle -list-under-dashed has-swl-gray-background-color has-background">
<li>どうにかして検定を1回にする</li>



<li>検定に順番を付ける（<a href="https://best-biostatistics.com/multiple/avoid.html" data-type="post" data-id="67">閉手順</a>）</li>



<li>有意水準を分ける（<a href="https://best-biostatistics.com/multiple/bonferroni.html" data-type="post" data-id="68">有名なのがボンフェローニ法</a>）</li>
</ol>



<p>といった方法が考えられます。</p>



<p>そして、多重性を考慮した検定なんかもあります。</p>



<p>有名なところで言うと、Tukey（テューキー）の検定、Dunnett（ダネット）の検定などです。</p>



<p>＞＞<a href="https://best-biostatistics.com/multiple/tukey.html">Tukey（テューキー）の検定とは？</a></p>



<p>＞＞<a href="https://best-biostatistics.com/multiple/dunnett.html">Dunnett（ダネット）の検定とは？</a></p>



<p>医薬研究で多重性が発生する場面、そして<a href="https://best-biostatistics.com/multiple/avoid.html" target="_blank" rel="noopener noreferrer">多重性を回避する方法に関しては別ページで解説しております</a>ので、ご参照ください。</p>











<h2 class="wp-block-heading">検定の多重性の意味：数撃ちゃ当たる理論</h2>


<div class="wp-block-image">
<figure class="aligncenter"><img decoding="async" width="640" height="321" src="https://best-biostatistics.com/wp/wp-content/uploads/2019/12/be6b6d2831a78a0beefd438ed32a685a_s-e1576476979527.jpg" alt="" class="wp-image-2506" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2019/12/be6b6d2831a78a0beefd438ed32a685a_s-e1576476979527.jpg 640w, https://best-biostatistics.com/wp/wp-content/uploads/2019/12/be6b6d2831a78a0beefd438ed32a685a_s-e1576476979527-300x150.jpg 300w" sizes="(max-width: 640px) 100vw, 640px" /></figure>
</div>






<p>多重性の問題は、つまるところ「数撃ちゃ当たる」ということです。</p>



<p><span style="text-decoration: underline;"><strong>αエラーを5%にするということは、20回に1回は間違いを許容する</strong></span>ということです。</p>



<p>そのため、データに対して100回ぐらい検定を実施して、P値が0.05を下回る結果があったぞー！！と言っても、それは多重性によりたまたま0.05を下回ったにすぎない可能性が高いです。</p>







<p>かの有名なノストラダムスも、この「多重性」を巧みに使って有名になった一人です。</p>



<p>ノストラダムスは、予言を何千も何万も用意していました。</p>



<p>たまたま、そのうちの何個かが的中したため、有名になったのです。</p>







<h2 class="wp-block-heading">検定の多重性とは？まとめ</h2>



<figure class="wp-block-image"><img decoding="async" width="700" height="369" src="https://best-biostatistics.com/wp/wp-content/uploads/2016/02/efefaqq.jpg" alt="" class="wp-image-2624" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2016/02/efefaqq.jpg 700w, https://best-biostatistics.com/wp/wp-content/uploads/2016/02/efefaqq-300x158.jpg 300w" sizes="(max-width: 700px) 100vw, 700px" /></figure>







<ul class="wp-block-list">
<li><span style="font-size: 16px;">多重性によるαエラーの増大が、医薬品開発にとって問題となる。</span></li>



<li><span style="font-size: 16px;">どうしても複数回の検定を実施したい場合には、全体のαエラーが5%未満になるように制御する必要がある。</span></li>
</ul>



<p class="border1"></p>
]]></content:encoded>
					
					<wfw:commentRss>https://best-biostatistics.com/multiple/alpha.html/feed</wfw:commentRss>
			<slash:comments>6</slash:comments>
		
		
			</item>
		<item>
		<title>ノンパラメトリック検定とパラメトリック検定とは？意味や種類をわかりやすく</title>
		<link>https://best-biostatistics.com/hypo_test/para.html</link>
					<comments>https://best-biostatistics.com/hypo_test/para.html#comments</comments>
		
		<dc:creator><![CDATA[beat1115]]></dc:creator>
		<pubDate>Fri, 25 Oct 2024 00:00:53 +0000</pubDate>
				<category><![CDATA[統計学的検定の基礎]]></category>
		<category><![CDATA[0.05]]></category>
		<category><![CDATA[P値]]></category>
		<category><![CDATA[有意水準]]></category>
		<category><![CDATA[統計学的検定]]></category>
		<guid isPermaLink="false">http://best-biostatistics.com/wp/2016/02/07/para/</guid>

					<description><![CDATA[<p><img src="https://best-biostatistics.com/wp/wp-content/uploads/2016/02/スクリーンショット-2018-10-14-10.49.32.png" class="webfeedsFeaturedVisual" /></p>検定とは何でしょうか？P値と有意水準の違いは？結果が良ければそれは真実？
検定の便利な点と、安易に検定をする怖さを解説します。
]]></description>
										<content:encoded><![CDATA[<p><img src="https://best-biostatistics.com/wp/wp-content/uploads/2016/02/スクリーンショット-2018-10-14-10.49.32.png" class="webfeedsFeaturedVisual" /></p>
<p>統計的検定を勉強していると、必ず出てくる「パラメトリック検定」と「ノンパラメトリック検定」。</p>



<p>T検定はパラメトリック検定で、ウィルコクソン順位和検定はノンパラメトリック検定です、と教科書に書いてあります。</p>







<p>・・・で、その２つの違いは何？</p>



<p>ってなりますよね。</p>



<p>今回の記事では、「パラメトリック検定」と「ノンパラメトリック検定」の意味や検定の種類に関して、例を交えてわかりやすく簡単に説明します。</p>







<h2 class="wp-block-heading">パラメトリック検定とはどんな意味なの？</h2>


<div class="wp-block-image">
<figure class="aligncenter"><img decoding="async" width="640" height="340" src="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/2ae4ec48eb55ae189560e8bb40caa89f_s-e1577089193118.jpg" alt="パラメトリック検定とはどんな意味なの？" class="wp-image-2529" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/2ae4ec48eb55ae189560e8bb40caa89f_s-e1577089193118.jpg 640w, https://best-biostatistics.com/wp/wp-content/uploads/2019/10/2ae4ec48eb55ae189560e8bb40caa89f_s-e1577089193118-300x159.jpg 300w" sizes="(max-width: 640px) 100vw, 640px" /></figure>
</div>






<p>パラメトリック検定というのは、<span style="color: #ff0000;"><strong>「事前にデータの分布を仮定している検定」</strong></span>になります。</p>



<p>例えば、<a href="https://best-biostatistics.com/stat-test/t-test.html" target="_blank" rel="noopener noreferrer">パラメトリック検定で一番有名なT検定</a>。</p>



<p><a href="https://best-biostatistics.com/stat-test/t-test.html" target="_blank" rel="noopener noreferrer"><strong>T検定の場合、データは正規分布に従っていることが前提</strong></a>になります。</p>







<p><a href="https://best-biostatistics.com/summary/normal_dist.html">正規分布</a>は、<a href="https://best-biostatistics.com/summary/diff-mean-median.html">平均値</a>と<a href="https://best-biostatistics.com/summary/sd-variance.html">標準偏差</a>が決まればその形が決まります。</p>



<p>言い換えると、<a href="https://best-biostatistics.com/summary/diff-mean-median.html">平均値</a>と<a href="https://best-biostatistics.com/summary/sd-variance.html">標準偏差</a>が正規分布の形を決める重要な要素です。</p>



<p>正規分布における平均値と標準偏差のように、<strong><span class="marker">分布を決める時の重要な要素を、パラメータと呼びます</span></strong>。</p>



<p>そのため、<span class="marker">「平均値と標準偏差は、正規分布のパラメータである」</span>と言うことができます。</p>







<p>T検定がやっていることは、二つの正規分布がどれぐらい離れているのか？を調べているということ。</p>



<p>この特性から、一つ言えることがあります。</p>







<div class="pointBox">
<p><span style="color: #ff0000;"><strong>T検定は、正規分布に従っていないデータでは、有意になりにくい。</strong></span></p>
</div>



<p>もう少し具体的に言うと、<span style="color: #ff0000;"><strong>外れ値があった場合に、T検定は有意になりにくい</strong></span>です。</p>







<p>平均値は<a href="https://best-biostatistics.com/summary/outlier.html" target="_blank" rel="noopener noreferrer">外れ値</a>にかなり影響を受けます。</p>



<p>そして、計算式の中で平均値を使っている標準偏差も、<a href="https://best-biostatistics.com/summary/outlier.html" target="_blank" rel="noopener noreferrer">外れ値</a>にかなり影響を受けます。</p>







<h3 class="wp-block-heading">パラメトリック検定を用いるのがふさわしい場面</h3>



<p>パラメトリック検定は、事前にデータの分布を知っている必要があります。</p>



<p>つまり、パラメトリック検定を用いたい場面は「すでに多くの研究でデータの分布がある程度わかっている場合」です。</p>







<p>例えば、身長や体重などは正規分布に従う事が知られています。</p>



<p>ということは、<a href="https://best-biostatistics.com/stat-test/t-test.html" target="_blank" rel="noopener noreferrer">身長や体重の平均値を比較する時には、パラメトリック検定であるT検定を使えば問題ありません</a>。</p>







<h2 class="wp-block-heading">ノンパラメトリック検定とはどんな意味なの？</h2>


<div class="wp-block-image">
<figure class="aligncenter"><img decoding="async" width="640" height="350" src="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/f3ff2b38f21bcd8da977db80ed2a0e7e_s-e1577089044626.jpg" alt="ノンパラメトリック検定とはどんな意味なの？" class="wp-image-2531" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/f3ff2b38f21bcd8da977db80ed2a0e7e_s-e1577089044626.jpg 640w, https://best-biostatistics.com/wp/wp-content/uploads/2019/10/f3ff2b38f21bcd8da977db80ed2a0e7e_s-e1577089044626-300x164.jpg 300w" sizes="(max-width: 640px) 100vw, 640px" /></figure>
</div>






<p>ノンパラメトリック検定とは、パラメトリックじゃない検定です。</p>



<p>つまり、<span class="marker">「事前にデータの分布を仮定しない検定」</span>になります。</p>



<p>例えば、<a href="https://best-biostatistics.com/stat-test/w-test.html" target="_blank" rel="noopener noreferrer">ウィルコクソンの順位和検定というのが、ノンパラメトリック検定の一つ</a>になります。</p>



<p>この場合、<strong>データがどんな分布（正規分布や対数正規分布など、何でも）であっても、有意になりやすさというのは同じ</strong>になります。</p>







<p>有意になりやすさを表にしてみるとこんな感じです。<br><!-- ★テーブルタグここから★ --></p>







<figure class="wp-block-table"><table class="has-fixed-layout"><tbody><tr><td>データの分布</td><td>T検定（パラメトリック）</td><td>ウィルコクソンの順位和検定（ノンパラメトリック）</td></tr><tr><td>正規分布</td><td>◎</td><td>◯</td></tr><tr><td>正規分布ではない</td><td>×</td><td>◯</td></tr></tbody></table></figure>







<p>注目したいのは、ウィルコクソンの順位和検定のオールマイティな性質です。</p>



<p>データが正規分布であっても、正規分布でなくとも、有意になりやすさが一定です。</p>







<h3 class="wp-block-heading">ノンパラメトリック検定の利点は？こんな時に使いやすい例</h3>



<p>ノンパラメトリック検定は「事前にデータの分布を考慮しなくても良い」という点でとても便利です。</p>



<p>身長や体重など、すでにそのデータの分布がわかっているデータに関しては、パラメトリックな検定をすればOKです。</p>







<p>しかしながら、例えば<strong><span class="marker">新規に作成したアンケートのデータなど、事前にデータがどのような分布になっているのかが想像もできない、というデータも世の中には存在します</span></strong>。</p>



<p>その場合には、ノンパラメトリック検定を実施する事がオススメ。</p>







<h2 class="wp-block-heading">ノンパラメトリック検定とパラメトリック検定ではどっちを使えばいいの？使い分けの判断は？</h2>



<p>ではパラメトリック検定とノンパラメトリック検定の、どちらを使えばよいか？というのが疑問になると思います。</p>



<p>ですが、そこには答えはありません。</p>



<p>大事な考え方は、<strong>「母集団がどのような分布になるか」を考えて決める</strong>ということです。</p>



<p>決して「得られたデータに一番フィットするという考え方で検定方法を決めてはいけない」のが重要です。</p>







<p>例えば、身長や体重などは正規分布に従うことが知られています。</p>



<p>そのため、今回の研究で得られているデータが正規分布っぽくなさそうでも、それはたまたまであると考えられ、母集団のデータは正規分布である、と考えることができます。</p>



<p>そのため、パラメトリック検定であるT検定を用いても、その解析手法は間違っているとは言えないのです。</p>







<h2 class="wp-block-heading">ノンパラメトリック検定とパラメトリック検定まとめ</h2>


<div class="wp-block-image">
<figure class="aligncenter"><img decoding="async" width="640" height="334" src="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/ec17114ba3d7d829dcd97f397b8c1421_s-e1577088691586.jpg" alt="ノンパラメトリック検定とパラメトリック検定まとめ" class="wp-image-2527" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/ec17114ba3d7d829dcd97f397b8c1421_s-e1577088691586.jpg 640w, https://best-biostatistics.com/wp/wp-content/uploads/2019/10/ec17114ba3d7d829dcd97f397b8c1421_s-e1577088691586-300x157.jpg 300w" sizes="(max-width: 640px) 100vw, 640px" /></figure>
</div>






<p>パラメトリック検定とノンパラメトリック検定の違いは、「事前にデータの分布を仮定しているかどうか」の違いです。</p>



<p>パラメトリック検定はデータの分布を仮定するため、すでにたくさんの研究がされてデータの分布がわかっている場合に有用です。</p>



<p>またノンパラメトリック検定は、アンケート調査など、新規にデータを取得する場合に特に有効です。</p>



<p class="border1"></p>




]]></content:encoded>
					
					<wfw:commentRss>https://best-biostatistics.com/hypo_test/para.html/feed</wfw:commentRss>
			<slash:comments>7</slash:comments>
		
		
			</item>
		<item>
		<title>片側検定と両側検定の違いや使い分けは？有意水準や棄却域はどう設定？</title>
		<link>https://best-biostatistics.com/hypo_test/one-way.html</link>
					<comments>https://best-biostatistics.com/hypo_test/one-way.html#comments</comments>
		
		<dc:creator><![CDATA[beat1115]]></dc:creator>
		<pubDate>Sun, 11 Aug 2024 04:00:50 +0000</pubDate>
				<category><![CDATA[統計学的検定の基礎]]></category>
		<category><![CDATA[0.05]]></category>
		<category><![CDATA[P値]]></category>
		<category><![CDATA[有意水準]]></category>
		<category><![CDATA[統計学的検定]]></category>
		<guid isPermaLink="false">http://best-biostatistics.com/wp/2016/02/07/one-way/</guid>

					<description><![CDATA[<p><img src="https://best-biostatistics.com/wp/wp-content/uploads/2023/04/データシード_YouTubeサムネイル-1024x576.png" class="webfeedsFeaturedVisual" /></p>統計学的検定を勉強していくと、「片側検定」と「両側検定」という用語に出会います。

あなたはこの「片側検定と両側検定の違い」を説明できますか？

違いを一言でいうと、「興味のある方向が1つだけかそうじゃないか」ということです。

…おそらく、これだけでは何のことかわかりませんね。

今回の記事は、そんな片側検定と両側検定の違いについて。

有意水準や棄却域の設定方法に関しても解説します。]]></description>
										<content:encoded><![CDATA[<p><img src="https://best-biostatistics.com/wp/wp-content/uploads/2023/04/データシード_YouTubeサムネイル-1024x576.png" class="webfeedsFeaturedVisual" /></p>
<p>統計学的検定を勉強していくと、「片側検定」と「両側検定」という用語に出会います。</p>



<p>あなたはこの「片側検定と両側検定の違い」を説明できますか？</p>



<p>違いを一言でいうと、「<strong><span class="marker">興味のある方向が1つだけかそうじゃないか</span></strong>」ということです。</p>



<p>…おそらく、これだけでは何のことかわかりませんね。</p>



<p>今回の記事は、そんな片側検定と両側検定の違いについて。</p>



<p>有意水準や棄却域の設定方法に関しても解説します。</p>







<h2 class="wp-block-heading">片側検定と両側検定の違いや使い分けは？</h2>


<div class="wp-block-image">
<figure class="aligncenter"><img decoding="async" width="640" height="345" src="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/987eca87017b5f2fa265f89558d4724a_s-e1577496841202.jpg" alt="片側検定と両側検定の違いや使い分けは？" class="wp-image-2530" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/987eca87017b5f2fa265f89558d4724a_s-e1577496841202.jpg 640w, https://best-biostatistics.com/wp/wp-content/uploads/2019/10/987eca87017b5f2fa265f89558d4724a_s-e1577496841202-300x162.jpg 300w" sizes="(max-width: 640px) 100vw, 640px" /></figure>
</div>






<p>片側検定と両側検定の違いに関して、コイン投げを例にして考えてみます。</p>



<p>例えばコインを100回、投げることにします。</p>



<p>その時に、「<strong>表が出る回数</strong>が極端に多いかどうか」に興味があって、それを検定する場合には片側検定になります。</p>



<p>そうではなく、「<strong>表か裏の、どちらかが出る回数</strong>が極端に多いかどうか」に興味があったとして、それを検定する場合には両側検定になります。</p>







<p>コイントスの結果は、「表が出る」か「裏が出るか」の2択です。</p>



<p>その時に<strong><span class="marker">”表か裏のどちらか一方”</span></strong>の結果だけに興味があれば片側検定。</p>



<p><strong><span class="marker">”表か裏のどっちでもいいから”</span></strong>極端な結果になるかどうかに興味があれば、両側検定です。</p>







<h3 class="wp-block-heading">片側検定と両側検定の違いをコイントスの例で考えてみる</h3>



<p>ちょっとイメージが難しい片側検定と両側検定。</p>



<p>ですが<a href="https://best-biostatistics.com/hypo_test/hypo.html" target="_blank" rel="noopener noreferrer">帰無仮説と対立仮説</a>を考えると、実は両者の違いは明確です。</p>







<p>まずは両側検定の場合の帰無仮説と対立仮説を確認してみます。</p>


<div class="swell-block-capbox cap_box is-style-small_ttl" data-colset="col1">
				<div class="cap_box_ttl"><span>両側検定の場合の帰無仮説と対立仮説</span></div>
				<div class="cap_box_content"> 帰無仮説H0：<strong>表が出る確率＝裏が出る確率</strong></p>
<p>対立仮説H1：<strong>表が出る確率<span style="color: #ff0000;">≠</span>裏が出る確率</strong></div>
			</div>







<p>次に、片側検定の場合の帰無仮説と対立仮説です。</p>


<div class="swell-block-capbox cap_box is-style-small_ttl" data-colset="col1">
				<div class="cap_box_ttl"><span>片側検定の場合の帰無仮説と対立仮説</span></div>
				<div class="cap_box_content"> 帰無仮説H0：<strong>表が出る確率＝裏が出る確率</strong></p>
<p>対立仮説H1：<strong>表が出る確率<span style="color: #ff0000;">＞</span>裏が出る確率</strong></div>
			</div>







<p>つまり、両側検定と片側検定では、<strong>帰無仮説は一緒ですが、証明したい対立仮説が異なる</strong>ということです。</p>







<h3 class="wp-block-heading">片側検定と両側検定の違いをT検定で考えてみる</h3>



<p>では次に、片側検定と両側検定の違いを<a href="https://best-biostatistics.com/stat-test/t-test.html">T検定</a>で考えてみます。</p>



<p>T検定の<a href="https://best-biostatistics.com/hypo_test/hypo.html" target="_blank" rel="noopener noreferrer">帰無仮説と対立仮説</a>は何かを見てみましょう。（A群とB群の2標本のT検定の場合）</p>







<p>まずは両側検定の場合の帰無仮説と対立仮説を確認してみます。</p>


<div class="swell-block-capbox cap_box is-style-small_ttl" data-colset="col1">
				<div class="cap_box_ttl"><span>両側検定の場合の帰無仮説と対立仮説</span></div>
				<div class="cap_box_content"> 帰無仮説H0：<strong>A群の母平均＝B群の母平均</strong></p>
<p>対立仮説H1：<strong>A群の母平均</strong><strong><span style="color: #ff0000;">≠</span>B群の母平均</strong></div>
			</div>



<div class="pointBox">

</div>



<p>次に、片側検定（A群の平均値の方が大きいと考える）の場合の帰無仮説と対立仮説です。</p>


<div class="swell-block-capbox cap_box is-style-small_ttl" data-colset="col1">
				<div class="cap_box_ttl"><span>片側検定の場合の帰無仮説と対立仮説</span></div>
				<div class="cap_box_content"> 帰無仮説H0：</p>
<p><strong>A群の母平均＝B群の母平均</strong></p>
<p>対立仮説H1：<strong>A群の母平均</strong><strong><span style="color: #ff0000;">＞</span>B群の母平均</strong><span style="font-size: 1em; letter-spacing: 0.05em;"></div>
			</div>











<p>先ほどのコイン投げの例と全く同じですね。</p>



<p>両側検定と片側検定では、<strong>帰無仮説は一緒ですが、証明したい対立仮説が異なる</strong>ということです。</p>



<p>ちなみに、B群の平均値の方が大きいと考える場合は、不等号の向きを変えて「<strong>A群の母平均</strong><strong><span style="color: #ff0000;">＜</span>B群の母平均</strong>」とすればOKです。</p>







<h2 class="wp-block-heading">臨床試験では片側検定と両側検定のどっちを使う？どっちに興味がある？</h2>


<div class="wp-block-image">
<figure class="aligncenter"><img decoding="async" width="640" height="323" src="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/7f418be16ff229275d0670150ea529e0_s-e1577088780405.jpg" alt="臨床試験では片側検定と両側検定のどっちを使う？どっちに興味がある？" class="wp-image-2528" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/7f418be16ff229275d0670150ea529e0_s-e1577088780405.jpg 640w, https://best-biostatistics.com/wp/wp-content/uploads/2019/10/7f418be16ff229275d0670150ea529e0_s-e1577088780405-300x151.jpg 300w" sizes="(max-width: 640px) 100vw, 640px" /></figure>
</div>






<p>臨床試験で新薬とプラセボを比較する状況での片側検定と両側検定を考えます。</p>



<p>すると、帰無仮説は<strong><span class="marker">“新薬の効果はプラセボの効果と同じ”</span></strong>です。</p>



<p>この帰無仮説は、片側検定でも両側検定でも同じですね。</p>







<p>片側検定の場合の対立仮説は、<strong><span class="marker">“新薬の効果はプラセボの効果よりも大きい“</span></strong>です。</p>



<p>つまり、数式では<strong><span class="marker">“新薬の効果＞プラセボの効果”</span></strong>となります。</p>







<p>両側検定の場合の対立仮説は、<strong><span class="marker">“新薬の効果はプラセボの効果とは異なる”</span></strong>です。</p>



<p>つまり、数式では<strong><span class="marker">“新薬の効果≠プラセボの効果”</span></strong>となります。</p>







<p>臨床試験では、一方にしか興味がないことが多いですね。</p>



<p>一方にしか興味がないというのはつまり、<span style="color: #ff0000;"><strong>「新薬の効果　＞　プラセボの効果」</strong></span>ということにしか興味がない場合です。</p>



<p><strong><span class="marker">「新薬の効果　＜　プラセボの効果」には興味がないですよね。</span></strong></p>



<p>そのため、臨床試験では全て片側検定でも良いのですが、なぜか慣例的に両側検定を使用しています。</p>



<p>ここには特に理由はありません。</p>



<p>私が担当した試験では片側検定で実施した試験もありますので、両側検定でなければダメだ、ということはありません。</p>







<h2 class="wp-block-heading">片側検定と両側検定で有意水準や棄却域はどうなるの？</h2>


<div class="wp-block-image">
<figure class="aligncenter"><img decoding="async" width="640" height="340" src="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/2ae4ec48eb55ae189560e8bb40caa89f_s-e1577089193118.jpg" alt="片側検定と両側検定で有意水準や棄却域はどうなるの？" class="wp-image-2529" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/2ae4ec48eb55ae189560e8bb40caa89f_s-e1577089193118.jpg 640w, https://best-biostatistics.com/wp/wp-content/uploads/2019/10/2ae4ec48eb55ae189560e8bb40caa89f_s-e1577089193118-300x159.jpg 300w" sizes="(max-width: 640px) 100vw, 640px" /></figure>
</div>






<p>片側検定と両側検定の違いは理解できましたか？</p>



<p>では次に、片側検定と両側検定の違いが、<a href="https://best-biostatistics.com/hypo_test/significant.html" target="_blank" rel="noopener noreferrer">有意水準や棄却域に対してどう関わってくるのかを確認します</a>。</p>







<p><a href="https://best-biostatistics.com/hypo_test/error.html" target="_blank" rel="noopener noreferrer">αエラー（第1種の過誤）は5%と明確に定められています</a>。</p>



<p>では、その5％を片側検定で使えたら、かなり有利になると思いませんか？</p>



<p>新薬とプラセボの差は、片側にしか興味がない（新薬＞プラセボ）ので、全て片側検定にして、有意水準を5％にする。</p>







<p>しかしながら、ICH E9（「臨床試験のための統計的原則」について）では、有意水準を明確に決めています。</p>



<p>つまり、<span style="color: #ff0000; font-size: 20px;"><strong>片側検定をする場合には有意水準を2.5%とし、両側検定の場合には5%とすること</strong></span>、が明記されています。</p>



<p>よって<strong>片側検定をする場合であっても5%のエラーを許容されていない</strong>ということです。</p>



<p>そのため、<strong>慣例的に臨床試験では両側検定で、有意水準を5%に設定する、ということが行われています</strong>。</p>







<h2 class="wp-block-heading">Rで片側検定と両側検定を実践する！</h2>



<p>実際に、サンプルデータを用いて片側検定と両側検定を実施します。</p>



<p>Rをダウンロードした際に含まれている「iris」というデータを使い、対応のないt検定とWilcoxonの順位和検定の2つを用いて実施します。</p>



<p>Rではt.test()関数やwilcox.test()関数の中で、alternative=””を指定することにより、片側検定か両側検定かを指定することができます。</p>



<p>alternative=””を指定しなければ、両側検定を実施します。alternative=””では下記の3つを指定することができます。</p>



<ul class="wp-block-list is-style-num_circle">
<li>two.sided：両側検定</li>



<li>less：1つ目に指定した変数が2つ目に指定した変数より小さいという片側検定</li>



<li>greater：1つ目に指定した変数が2つ目に指定した変数より大きいという片側検定</li>
</ul>



<pre class="wp-block-code has-white-color has-black-background-color has-text-color has-background has-link-color wp-elements-b6338c4fd2c80a4146c45d95a0467ff3"><code># データの読み込み
data("iris")

# データの確認
head(iris)

# SetosaとVersicolorのデータ抽出
setosa &lt;- subset(iris, Species == "setosa")
versicolor &lt;- subset(iris, Species == "versicolor")

# 対応のないt検定での両側検定と片側検定
t_test_two &lt;- t.test(setosa$Sepal.Length, versicolor$Sepal.Length, alternative = "two.sided")
t_test_less &lt;- t.test(setosa$Sepal.Length, versicolor$Sepal.Length, alternative = "less")
t_test_greater &lt;- t.test(setosa$Sepal.Length, versicolor$Sepal.Length, alternative = "greater")

print(t_test_two) 
print(t_test_less)
print(t_test_greater)</code></pre>



<p>上記のプログラムを実行すると、下記のように結果得られます。（見やすさの観点から、p値のみ記載します。）</p>



<figure class="wp-block-table"><table class="has-fixed-layout"><tbody><tr><td>alternative=&#8221;&#8221;の指定</td><td>p値</td></tr><tr><td>two.sided</td><td>2.2e-16</td></tr><tr><td>less</td><td>2.2e-16</td></tr><tr><td>greater</td><td>1</td></tr></tbody></table></figure>



<p>e-16は、10のマイナス16乗の意味です。そのため「めちゃめちゃ小さいp値である」ということがわかります。</p>



<p>次に、ウィルコクソンの順位和検定で両側検定と片側検定を実施します。</p>



<pre class="wp-block-code has-white-color has-black-background-color has-text-color has-background has-link-color wp-elements-3239da6ae1caabf9f7b21d14397621c9"><code># ウィルコクソンの順位和検定での両側検定と片側検定
wilcox_test_two &lt;- wilcox.test(setosa$Sepal.Length, versicolor$Sepal.Length, alternative = "two.sided")
wilcox_test_less &lt;- wilcox.test(setosa$Sepal.Length, versicolor$Sepal.Length, alternative = "less")
wilcox_test_greater &lt;- wilcox.test(setosa$Sepal.Length, versicolor$Sepal.Length, alternative = "greater")

print(wilcox_test_two) 
print(wilcox_test_less)
print(wilcox_test_greater)</code></pre>



<figure class="wp-block-table"><table class="has-fixed-layout"><tbody><tr><td>alternative=&#8221;&#8221;の指定</td><td>p値</td></tr><tr><td>two.sided</td><td>8.346e-14</td></tr><tr><td>less</td><td>4.173e-14</td></tr><tr><td>greater</td><td>1</td></tr></tbody></table></figure>



<h2 class="wp-block-heading">片側検定と両側検定の違いや使い分けまとめ</h2>


<div class="wp-block-image">
<figure class="aligncenter"><img decoding="async" width="640" height="334" src="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/ec17114ba3d7d829dcd97f397b8c1421_s-e1577088691586.jpg" alt="片側検定と両側検定の違いや使い分けまとめ" class="wp-image-2527" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/ec17114ba3d7d829dcd97f397b8c1421_s-e1577088691586.jpg 640w, https://best-biostatistics.com/wp/wp-content/uploads/2019/10/ec17114ba3d7d829dcd97f397b8c1421_s-e1577088691586-300x157.jpg 300w" sizes="(max-width: 640px) 100vw, 640px" /></figure>
</div>






<p>片側検定と両側検定の違いは「どちらに興味があるのか」という違いでした。</p>



<p>臨床試験では「新薬の効果＞プラセボの効果」にしか興味がないため、片側検定でも成り立ちます。</p>



<p>ですが、慣例的には両側検定で5％の有意水準を設定して試験を実施する事が多いです。</p>
]]></content:encoded>
					
					<wfw:commentRss>https://best-biostatistics.com/hypo_test/one-way.html/feed</wfw:commentRss>
			<slash:comments>2</slash:comments>
		
		
			</item>
		<item>
		<title>F検定とは？わかりやすくF分布のグラフからP値の読み取り方まで</title>
		<link>https://best-biostatistics.com/stat-test/f-test.html</link>
					<comments>https://best-biostatistics.com/stat-test/f-test.html#comments</comments>
		
		<dc:creator><![CDATA[beat1115]]></dc:creator>
		<pubDate>Thu, 08 Aug 2024 09:40:30 +0000</pubDate>
				<category><![CDATA[個々の統計検定の説明]]></category>
		<category><![CDATA[統計学的検定]]></category>
		<guid isPermaLink="false">https://best-biostatistics.com/?p=2360</guid>

					<description><![CDATA[<p><img src="https://best-biostatistics.com/wp/wp-content/uploads/2019/12/ScreenShot-2019-12-11-13.46.05.png" class="webfeedsFeaturedVisual" /></p>データの分散が等しいかどうかを検定する時に用いるF検定。 F検定は、T検定の前に、等分散かどうかを確かめるときによく用います。 ではF検定はどのようなことが行われているのでしょうか? また、T検定との関係はどういったもの [&#8230;]]]></description>
										<content:encoded><![CDATA[<p><img src="https://best-biostatistics.com/wp/wp-content/uploads/2019/12/ScreenShot-2019-12-11-13.46.05.png" class="webfeedsFeaturedVisual" /></p>
<p>データの分散が等しいかどうかを検定する時に用いるF検定。</p>



<p>F検定は、T検定の前に、等分散かどうかを確かめるときによく用います。</p>



<p>ではF検定はどのようなことが行われているのでしょうか?</p>



<p>また、T検定との関係はどういったものなのでしょうか?</p>



<p>この記事ではF検定について、わかりやすく説明していきます。</p>



<h2 class="wp-block-heading">F検定とは?わかりやすく説明するとどんな検定？</h2>


<div class="wp-block-image">
<figure class="aligncenter"><img decoding="async" width="800" height="474" src="https://best-biostatistics.com/wp/wp-content/uploads/2019/11/43456c92f2f7a865f6c6fe3001cb59d8_l-scaled-e1573632101681.jpg" alt="F検定とは?わかりやすく説明するとどんな検定？" class="wp-image-2322" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2019/11/43456c92f2f7a865f6c6fe3001cb59d8_l-scaled-e1573632101681.jpg 800w, https://best-biostatistics.com/wp/wp-content/uploads/2019/11/43456c92f2f7a865f6c6fe3001cb59d8_l-scaled-e1573632101681-300x178.jpg 300w, https://best-biostatistics.com/wp/wp-content/uploads/2019/11/43456c92f2f7a865f6c6fe3001cb59d8_l-scaled-e1573632101681-768x455.jpg 768w" sizes="(max-width: 800px) 100vw, 800px" /></figure>
</div>


<p><strong><span class="marker">F検定とは、ズバリ、&#8221;分散が等しい&#8221;かどうかを調べる検定です</span></strong>。</p>



<p><a href="https://best-biostatistics.com/summary/sd-variance.html">”分散”は、データのばらつきを示す指標</a>ですよね。</p>



<p>なぜばらつきが等しいかどうかを調べなきゃいけないの？</p>



<p>どんな時に分散を調べる必要があるの？</p>



<p>というのが疑問です。</p>



<h3 class="wp-block-heading">F検定とT検定との関係</h3>



<p>F検定がもっともよく使われるのは、間違いなくT検定のとき。</p>



<p><strong><span class="marker">T検定では、比較する群が等分散か、等分散ではないかで、統計の手法が変わってきます。</span></strong></p>



<ul class="wp-block-list">
<li><strong>比較する群が等分散（分散が等しい）のときは、スチューデントのT検定、</strong></li>



<li><strong>等分散ではないときはウェルチのT検定を用います。</strong></li>
</ul>



<p>そのため、<strong><span style="text-decoration: underline;">等分散か、等分散ではないか、を調べるときにF検定を使います</span>。</strong></p>



<p>しかし、<span class="marker"><strong>T検定前に等分散かどうかの検定を行うとは正しくない</strong></span>という意見もあり、今ではF検定を行わずに、等分散の仮定が不要な、ウェルチのT検定を用いたりします。</p>



<blockquote class="wp-block-quote is-layout-flow wp-block-quote-is-layout-flow">
<p>&gt;&gt;<a href="https://best-biostatistics.com/stat-test/t-test.html">T検定とは？帰無仮説と対立仮説を必ず確認！F検定で等分散の確認が必要？</a></p>
</blockquote>



<p>（ちなみに私はF検定使用しない方がいい派です。）</p>



<p>では、F検定ってどういうときに使うのでしょうか?</p>



<h3 class="wp-block-heading">F検定はいつ使われるのか?</h3>



<p>F検定はT検定のときは、あまり使われなくなりました。</p>



<p>しかし、それでもF検定はたくさん使われています。</p>



<p>それは、<strong>「分散分析: ANOVA (analysis of variance)」</strong>です。</p>



<p>２つのグループの平均の違いを調べるのがT検定でしたが、</p>



<p>分散分析では3つ以上のグループのときに、用いる方法です。</p>



<p>&gt;&gt;&gt;<a href="https://best-biostatistics.com/stat-test/anova.html">分散分析とは？分散分析表の見方やf値とp値の意味もわかりやすく！　</a></p>



<p>では、F検定が実際にどのようなものかをみていきましょう。</p>



<h3 class="wp-block-heading">F検定を知る上で重要なF分布をわかりやすく！</h3>



<p>F検定を説明するうえで欠かせないのがF分布です。</p>



<p>F分布の式はややこしいのでここでは説明しませんが、ここでは、F分布はどんなものかを説明します。</p>



<p>ちなみにF分布はこういう形をしています。<img decoding="async" class="alignnone wp-image-2459 size-full" src="https://best-biostatistics.com/wp/wp-content/uploads/2019/12/スクリーンショット-2019-12-02-16.38.14.png" alt="F検定を知る上で重要なF分布をわかりやすく！" width="1166" height="840" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2019/12/スクリーンショット-2019-12-02-16.38.14.png 1166w, https://best-biostatistics.com/wp/wp-content/uploads/2019/12/スクリーンショット-2019-12-02-16.38.14-300x216.png 300w, https://best-biostatistics.com/wp/wp-content/uploads/2019/12/スクリーンショット-2019-12-02-16.38.14-1024x738.png 1024w, https://best-biostatistics.com/wp/wp-content/uploads/2019/12/スクリーンショット-2019-12-02-16.38.14-768x553.png 768w" sizes="(max-width: 1166px) 100vw, 1166px" /></p>



<p><strong><span class="marker">F分布の特徴は、正規分布とは異なり、左右対称ではないことです。</span></strong></p>



<p>あた、この分布の形は２つの自由度から求めることができますが、自由度については後ほど説明します。</p>



<p>もう一点重要なこととして、F分布を説明するにはカイ二乗分布がかかせません。</p>



<p>どういうことかと言いますと、次のような法則あるからです。</p>



<p>標準正規分布に従う独立なn個の変数がありこれらをu<sub>1</sub>、u<sub>2</sub>、・・・u<sub>n</sub>とします。</p>



<p>&gt;&gt;&gt;<a href="https://best-biostatistics.com/summary/standard-norm.html">標準正規分布表の見方について！標準化やZ値の計算式はどうすればいい？</a></p>



<p>このとき、u<sub>1</sub>、u<sub>2</sub>、・・・u<sub>n</sub>の変数の2乗和は、</p>



<p>x=u<sub>1</sub><sup>2</sup>+u<sub>2</sub><sup>2</sup>+・・・+u<sub>n</sub><sup>2</sup></p>



<p>と表すことができます。</p>



<p>このときの<span style="color: #ff0000;"><strong>xは自由度nのカイ二乗分布に従う。</strong></span></p>



<p>このxは分散をnで割っていないだけの値ですよね。</p>



<p>これは、一つの分布についての法則です。</p>



<p>F分布は2つの分布を比べるときに出てくる法則です。</p>



<p><strong>自由度k<sub>1</sub>のカイ二乗分布に従う変数をu<sub>1</sub> 、自由度k<sub>2</sub>のカイ二乗分布に従う変数をu<sub>2</sub>、のカイ二乗値の比</strong></p>



<p>$$F = \frac{\chi^2_1 / k_1}{\chi^2_2 / k_2} = \frac{\chi^2_1 / (n_1 &#8211; 1)}{\chi^2_2 / (n_2 &#8211; 1)} = \frac{\frac{(n_1 &#8211; 1)s_1^2}{\sigma_1^2} / (n_1 &#8211; 1)}{\frac{(n_2 &#8211; 1)s_2^2}{\sigma_2^2} / (n_2 &#8211; 1)} = \frac{s_1^2 / \sigma_1^2}{s_2^2 / \sigma_2^2}$$</p>



<p><strong>はF分布に従う。</strong></p>



<p>要するに、分散の比がF分布に従うということ。</p>



<p>F分布はこの法則にしたがっており、F検定ではF分布を用いて検定を行います。</p>



<p>また、<strong><span class="marker">F検定は通常、データが正規分布をしていることが前提なのも注意が必要</span></strong>です。</p>



<p>そのため、近年は正規分布に従わなくても使える検定法も考案されています。</p>



<div class="concept-box1">
<ul>
<li><strong>自由度k<sub>1</sub>のカイ二乗分布に従う変数をu<sub>1</sub> 、自由度k<sub>2</sub>のカイ二乗分布に従う変数をu<sub>2</sub>、のカイ二乗値の比</strong><strong>はF分布に従う。$$F = \frac{\chi^2_1 / k_1}{\chi^2_2 / k_2} = \frac{\chi^2_1 / (n_1 &#8211; 1)}{\chi^2_2 / (n_2 &#8211; 1)} = \frac{\frac{(n_1 &#8211; 1)s_1^2}{\sigma_1^2} / (n_1 &#8211; 1)}{\frac{(n_2 &#8211; 1)s_2^2}{\sigma_2^2} / (n_2 &#8211; 1)} = \frac{s_1^2 / \sigma_1^2}{s_2^2 / \sigma_2^2}$$</strong></li>
<li><strong>F検定は通常、データが正規分布をしていることが前提</strong></li>
</ul>
</div>



<h3 class="wp-block-heading">F検定における自由度とは？</h3>



<p>ここで自由度が出てきたので、説明しましょう。</p>



<p><a href="https://best-biostatistics.com/contingency/degree-freedom.html" target="_blank" rel="noopener noreferrer">カイ二乗検定における自由度に関しては、こちらの記事をご参照ください。</a></p>



<p><span style="color: #ff0000;"><strong>自由度とは、変数のうち独立に選べるものの数のこと</strong></span>をいいます。</p>



<p>ここでは例として、三角形の内角の和を考えます。</p>



<p>角A、B、Cからなる三角形の内角の和は180°です。</p>



<p>このとき、<strong><span class="marker">三角形の自由度は2</span></strong>です。</p>


<div class="wp-block-image">
<figure class="aligncenter"><img decoding="async" width="300" height="263" src="https://best-biostatistics.com/wp/wp-content/uploads/2019/12/naikaku1-e1576039232977.png" alt="F検定を詳しく知る" class="wp-image-2480"/></figure>
</div>


<p>理由は、<strong><span class="marker">自由に決めれる内角は2つしかないから</span></strong>です。</p>



<p>例えば、角Aを60°と決めたとします。</p>



<p>このとき、BとCの合計が120°になれば、あとはBとCの内角は自由に決めることができます。</p>



<p>次にBを30°と決めたとします。</p>



<p>すると、Cは90°と決まってしまします。</p>



<p>角Aと角Bの２つは自由に決められたが、AとB が決まるとCが勝手に決まるので、</p>



<p>このときは自由度2といいます。</p>



<p><span class="marker"><strong>カイ二乗分布やF分布では、何個の確率変数をとれるかが、自由度に対応しています。</strong></span></p>



<p>通常、自由度は標本のデータ数から1を引いた値を用います。</p>



<h2 class="wp-block-heading">F検定の帰無仮説と対立仮説：P値が有意になったらどんな結論？</h2>



<p>それでは、F検定について考えていきます。</p>



<p>F検定では次のような<a href="https://best-biostatistics.com/hypo_test/hypo.html" target="_blank" rel="noopener noreferrer">帰無仮説と対立仮説</a>を立てます。</p>



<ul class="wp-block-list">
<li><strong>帰無仮説：2グループの分散に差がない</strong></li>



<li><strong>対立仮説：2グループの分散に差がある</strong></li>
</ul>



<figure class="wp-block-image"><img decoding="async" width="1380" height="926" src="https://best-biostatistics.com/wp/wp-content/uploads/2019/12/スクリーンショット-2019-12-02-17.15.54.png" alt="F検定の帰無仮説と対立仮説：P値が有意になったらどんな結論？" class="wp-image-2460" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2019/12/スクリーンショット-2019-12-02-17.15.54.png 1380w, https://best-biostatistics.com/wp/wp-content/uploads/2019/12/スクリーンショット-2019-12-02-17.15.54-300x201.png 300w, https://best-biostatistics.com/wp/wp-content/uploads/2019/12/スクリーンショット-2019-12-02-17.15.54-1024x687.png 1024w, https://best-biostatistics.com/wp/wp-content/uploads/2019/12/スクリーンショット-2019-12-02-17.15.54-768x515.png 768w" sizes="(max-width: 1380px) 100vw, 1380px" /></figure>



<p>有意水準が0.05であれば、</p>



<p><strong>上の図の面積が0.05以下のときに、帰無仮説が棄却されることになり、2つのグループの分散には差があると結論づけられます。</strong></p>



<p>F分布表では、二つの自由度から、面積が0.05になる横軸の値が書かれています。</p>



<p>二つの自由度はそれぞれの標本のデータ数から1を引いた値を用います。</p>



<p>そのため、<strong><span class="marker">その値よりも横軸が大きければ、有意に分散が違うということができます。</span></strong></p>


<div class="wp-block-image">
<figure class="aligncenter"><img decoding="async" width="600" height="305" src="https://best-biostatistics.com/wp/wp-content/uploads/2019/12/step0.png" alt="F検定の帰無仮説と対立仮説：P値が有意になったらどんな結論？2" class="wp-image-2481" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2019/12/step0.png 600w, https://best-biostatistics.com/wp/wp-content/uploads/2019/12/step0-300x153.png 300w" sizes="(max-width: 600px) 100vw, 600px" /></figure>
</div>


<p>ちなみに上の図では、自由度が10と10になるため、有意になる横軸の値は2.98です。</p>



<h2 class="wp-block-heading">F検定をわかりやすく！まとめ</h2>


<div class="wp-block-image">
<figure class="aligncenter"><img decoding="async" width="640" height="344" src="https://best-biostatistics.com/wp/wp-content/uploads/2019/11/53e0d72ad9bae4b1e39c3b1c6bf377dd_s-e1573554634921.jpg" alt="F検定をわかりやすく！まとめ" class="wp-image-2320" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2019/11/53e0d72ad9bae4b1e39c3b1c6bf377dd_s-e1573554634921.jpg 640w, https://best-biostatistics.com/wp/wp-content/uploads/2019/11/53e0d72ad9bae4b1e39c3b1c6bf377dd_s-e1573554634921-300x161.jpg 300w" sizes="(max-width: 640px) 100vw, 640px" /></figure>
</div>


<p>ここでは、F検定について見ていきました。</p>



<p>F検定は分散の違いに関する検定で、T検定を実施する前に使われることが多いです。</p>



<p>しかし、どのT検定を使うのかという判断に対してF検定を使うことには議論があって、私自身はF検定は不要だと思っております。</p>



<p>F検定は二つの自由度を用いて行います。</p>
]]></content:encoded>
					
					<wfw:commentRss>https://best-biostatistics.com/stat-test/f-test.html/feed</wfw:commentRss>
			<slash:comments>1</slash:comments>
		
		
			</item>
		<item>
		<title>P値とはどんな意味？p-valueの手計算方法や求め方を例でわかりやすく</title>
		<link>https://best-biostatistics.com/hypo_test/p-value.html</link>
					<comments>https://best-biostatistics.com/hypo_test/p-value.html#comments</comments>
		
		<dc:creator><![CDATA[beat1115]]></dc:creator>
		<pubDate>Mon, 07 Aug 2023 10:10:05 +0000</pubDate>
				<category><![CDATA[統計学的検定の基礎]]></category>
		<category><![CDATA[0.05]]></category>
		<category><![CDATA[P値]]></category>
		<category><![CDATA[有意水準]]></category>
		<category><![CDATA[統計学的検定]]></category>
		<guid isPermaLink="false">http://best-biostatistics.com/wp/2016/02/07/p-value/</guid>

					<description><![CDATA[<p><img src="https://best-biostatistics.com/wp/wp-content/uploads/2016/02/スクリーンショット-2018-10-21-06.56.45.png" class="webfeedsFeaturedVisual" /></p>検定とは何でしょうか？P値と有意水準の違いは？結果が良ければそれは真実？
検定の便利な点と、安易に検定をする怖さを解説します。
]]></description>
										<content:encoded><![CDATA[<p><img src="https://best-biostatistics.com/wp/wp-content/uploads/2016/02/スクリーンショット-2018-10-21-06.56.45.png" class="webfeedsFeaturedVisual" /></p><p>あなたは、P値って何なのか、考えたことはあるでしょうか？</p>
<p>以前、参加したことのある統計セミナーで「P値を説明してください」という問題が出たことがあります。</p>
<p>あなたはどう回答しますか？</p>
<p>そのセミナーの中で、面白かった回答がありました。</p>
<p>「0.05を切ったら嬉しいもの」</p>
<p>まぁ確かにな、と思いました。</p>
<p>&nbsp;</p>
<p>P値ほど、誤解されて使われているものはありません。</p>
<p>とりあえず0.05を下回ったら、何も考えずにOK。</p>
<p>そんな使い方をされていることが多い。</p>
<p>でも、実はそれ以上にP値は深い意味を持っています。</p>
<p>このページでぜひともP値は何かを学んでいきましょう！</p>
<p>手計算での求め方を、コイン投げを例にして解説しますね！</p>
<p>&nbsp;</p>
<h2>P値とはどんな意味かをわかりやすく教えて！</h2>
<p><img decoding="async" class="aligncenter wp-image-2530 size-full" src="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/987eca87017b5f2fa265f89558d4724a_s-e1577496841202.jpg" alt="P値とはどんな意味かをわかりやすく教えて！" width="640" height="345" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/987eca87017b5f2fa265f89558d4724a_s-e1577496841202.jpg 640w, https://best-biostatistics.com/wp/wp-content/uploads/2019/10/987eca87017b5f2fa265f89558d4724a_s-e1577496841202-300x162.jpg 300w" sizes="(max-width: 640px) 100vw, 640px" /></p>
<p>まずは、P値って何かを考えたことはありますか？</p>
<p>P値。ピーチ。</p>
<p>・・・桃？？</p>
<p>&nbsp;</p>
<p>冗談はさておき、P値は「何かの確率」を示しています。</p>
<p>ちなみにP値の「P」は「Probability」の略です。「確率」ですね。</p>
<p>重要なのは、「何の」確率か、ということです。</p>
<p>&nbsp;</p>
<h3>P値（p-value）の意味は帰無仮説下で、その結果以上（以下）が出る確率である</h3>
<p>正解を先に言います。</p>
<p>P値は以下の言葉で言い換えることができます。</p>
<p><div class="swell-block-capbox cap_box is-style-small_ttl" data-colset="col1">
				<div class="cap_box_ttl"><span>P値とは？</span></div>
				<div class="cap_box_content"> <strong><a href="https://best-biostatistics.com/hypo_test/hypo.html">帰無仮説</a>を考えている時に、得られた結果より極端な結果が出る確率</strong></div>
			</div></p>
<p>&nbsp;</p>
<p>わかりますか？</p>
<p>おそらく文字だけで説明されても全然わからないと思いますので、コインを例に考えてみましょう。</p>
<p>&nbsp;</p>
<h2>P値の求め方を手計算で求めながら、意味をコイン投げの事例で学ぶ</h2>
<p><img decoding="async" class="aligncenter wp-image-2529 size-full" src="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/2ae4ec48eb55ae189560e8bb40caa89f_s-e1577089193118.jpg" alt="P値の求め方を手計算で求めながら、意味をコイン投げの事例で学ぶ" width="640" height="340" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/2ae4ec48eb55ae189560e8bb40caa89f_s-e1577089193118.jpg 640w, https://best-biostatistics.com/wp/wp-content/uploads/2019/10/2ae4ec48eb55ae189560e8bb40caa89f_s-e1577089193118-300x159.jpg 300w" sizes="(max-width: 640px) 100vw, 640px" /></p>
<p>コイントスで、<strong>表が出たら1万円をもらえる、裏が出たら1万円を支払う</strong>、という場面を想定します。</p>
<p>そしてあなたは、そのコインがイカサマであれば参加しない。</p>
<p>つまり<span class="marker">裏が出やすいコインである、ということであれば参加したくない</span>と思っています。</p>
<p>&nbsp;</p>
<p>では、その「イカサマなコインである」を統計学的に証明していきましょう。</p>
<p>まずは、<a href="https://best-biostatistics.com/hypo_test/hypo.html" target="_blank" rel="noopener noreferrer">帰無仮説と対立仮説</a>を考えます。</p>
<p>&nbsp;</p>
<p>今回のコイン投げの場合、帰無仮説と対立仮説はどのようになるでしょうか？</p>
<p>このようになりますね。</p>
<p>&nbsp;</p>
<p><div class="swell-block-capbox cap_box is-style-small_ttl" data-colset="col1">
				<div class="cap_box_ttl"><span>コイン投げの場合の帰無仮説と対立仮説</span></div>
				<div class="cap_box_content"> </p>
<p><strong>帰無仮説は「コインはイカサマでない」</strong></p>
<p><strong>対立仮説は「コインはイカサマである」</strong></p>
<p></div>
			</div></p>
<div class="boldBox">
<p>&nbsp;</p>
</div>
<p>ではここで一つ問題です。</p>
<div class="questionBox">
<p><strong><span class="marker">帰無仮説「コインはイカサマでない」という前提に立った場合に、裏（若しくは表）が出る確率はどうなるでしょうか？</span></strong></p>
</div>
<p>帰無仮説を考えている場合とは言い換えると、「コインはイカサマではない」という場合を想定しています。</p>
<p>つまり、あなたが普段持っている100円玉を投げた時に、どんな確率で裏（もしくは表）が出るかということです。</p>
<p>&nbsp;</p>
<p>当然わかりますよね。</p>
<div class="exclamationBox">
<p><strong><span class="marker">帰無仮説「コインはイカサマでない」という前提に立った場合に、裏（若しくは表）が出る確率は1/2である</span></strong></p>
</div>
<p>&nbsp;</p>
<h3>P値を手計算するために10人のコイン投げの結果を観察してみる</h3>
<p>そして、このコインがイカサマかどうかを確かめるために、自分より前の10人の結果を調べることにしました。</p>
<p>10人の結果を見てみましょう。</p>
<p><strong>帰無仮説では表が出る確率は1/2であるため、10回中５回は表が出るはず</strong>です。</p>
<p>ですが、たまたま表が７回でたり、反対に２回しか出ない時もあります。</p>
<p>&nbsp;</p>
<p>つまり、10人のコイン投げで表が出る回数は、0〜10回があり得ます。</p>
<p>あなたの想像の通り、<strong><span class="marker">10回コインを投げたうち、10回表が出ることは稀で、0回表が出ることも稀です</span></strong>。</p>
<p>そんなあなたの考えを確率で表現したのが以下の表です。<br />
<!-- ★テーブルタグここから★ --></p>
<p>&nbsp;</p>
<table style="border-collapse: collapse; width: 100%;" border="1">
<tbody>
<tr>
<td style="width: 10%; text-align: center;">表が出る回数</td>
<td style="width: 10%; text-align: center;">0</td>
<td style="width: 10%; text-align: center;">1</td>
<td style="width: 10%; text-align: center;">2</td>
<td style="width: 10%; text-align: center;">3</td>
<td style="width: 10%; text-align: center;">4</td>
<td style="width: 10%; text-align: center;">5</td>
<td style="width: 10%; text-align: center;">6</td>
<td style="width: 10%; text-align: center;">7</td>
<td style="width: 5%; text-align: center;">8</td>
<td style="width: 2.5%; text-align: center;">9</td>
<td style="width: 2.5%; text-align: center;">10</td>
</tr>
<tr>
<td style="width: 10%; text-align: center;">確率</td>
<td style="width: 10%; text-align: center;">0.001</td>
<td style="width: 10%; text-align: center;">0.010</td>
<td style="width: 10%; text-align: center;">0.044</td>
<td style="width: 10%; text-align: center;">0.117</td>
<td style="width: 10%; text-align: center;">0.205</td>
<td style="width: 10%; text-align: center;">0.246</td>
<td style="width: 10%; text-align: center;">0.205</td>
<td style="width: 10%; text-align: center;">0.117</td>
<td style="width: 5%; text-align: center;">0.044</td>
<td style="width: 2.5%; text-align: center;">0.010</td>
<td style="width: 2.5%; text-align: center;">0.001</td>
</tr>
<tr>
<td style="width: 10%; text-align: center;">累積確率</td>
<td style="width: 10%; text-align: center;">0.001</td>
<td style="width: 10%; text-align: center;">0.011</td>
<td style="width: 10%; text-align: center;">0.055</td>
<td style="width: 10%; text-align: center;">00.172</td>
<td style="width: 10%; text-align: center;">0.377</td>
<td style="width: 10%; text-align: center;">0.623</td>
<td style="width: 10%; text-align: center;">0.828</td>
<td style="width: 10%; text-align: center;">0.945</td>
<td style="width: 5%; text-align: center;">0.989</td>
<td style="width: 2.5%; text-align: center;">0.999</td>
<td style="width: 2.5%; text-align: center;">1.000</td>
</tr>
</tbody>
</table>
<p>&nbsp;</p>
<p><!-- ★テーブル用スタイルここまで★ -->これは、二項確率というものを計算しています。<!-- ★テーブルタグここまで★ --></p>
<p>例えば「表が出る回数3」の確率というのは、10回コイン投げをした場合に、3回表が出る確率を二項確率の計算式を元に計算しています。</p>
<p>&nbsp;</p>
<p>表を見ると、あなたが想像している通り、<span class="marker">10回中５回表が出る確率が24.6%と一番高い</span>です。</p>
<p>一方で、<span class="marker">０回や10回表が出る確率は0.1%と、一番小さい確率</span>です。</p>
<p>&nbsp;</p>
<p>一番下の行は、<strong>累積確率と呼ばれ、左から順に確率を足し合わせたもの</strong>になります。</p>
<p>例えば「表が出る回数が2回」のところにある累積確率（0.055）は、0回の確率と1回の確率と2回の確率を全て足し合わせた結果になっています。</p>
<p>つまり、<span class="marker">0.001+0.010+0.044=0.055</span>です。</p>
<p>&nbsp;</p>
<h3>P値とは累積確率</h3>
<p>そして、この<strong>「累積確率」がP値</strong>になります。</p>
<p>・・・たぶん、ぽかーんとしている方が大半かもしれません。。</p>
<p>ですが、そうなのです。</p>
<p>一般化してP値を言葉で置き換えます。</p>
<p>&nbsp;</p>
<div class="simple-box1">
<p><strong>P値とは、帰無仮説下（表が出る確率は1/2である）での、その結果より極端な結果が出る確率</strong></p>
</div>
<p>&nbsp;</p>
<p>このP値が0.05より小さければ、想定している仮説（帰無仮説）の下では、その結果が出る確率は0.05以下でしかない。</p>
<p>このコイン投げの例でいうと、<strong>「1/2は表が出ると想定しているのに、その結果が出る確率は0.05以下しかない」</strong></p>
<p>そのような結果が出た場合に、<strong><span class="marker">想定している仮説が間違っている（＝帰無仮説が間違っている）んじゃないか</span></strong>。</p>
<p>と考えます。</p>
<p>つまり、帰無仮説を棄却し、対立仮説を採択するのです。</p>
<p>&nbsp;</p>
<p>このコインの例では、表が1回以下である確率が0.011であり、2回以下である確率が0.055です。</p>
<p>そのため、イカサマであると判断する数値的な閾値を0.05とした場合には、10回分の結果から、<strong>表が1回以下であればこのコインはイカサマであると結論付け、ゲームには参加しないという判断を下す</strong>という流れです。</p>
<p>&nbsp;</p>
<h2>数値としてのp値は「要約統計量の一つ」である</h2>
<p>統計学としての理論的なp値は、上記で解説した「確率」として定義されるものです。</p>
<p>しかしそれはあくまで、数学的概念としてのp値。</p>
<p>一方で、<span class="marker"><strong>出力された「数字としてのp値」は、<a href="https://best-biostatistics.com/stat-test/toukeiryou.html">検定統計量</a>を変換して計算された、要約指標の一種</strong></span>です。</p>
<p>確率変数と言っても良い指標であり、確率変数であれば何らかの確率分布に従う。（引用：<a href="https://www.amazon.co.jp/%E5%8C%BB%E5%AD%A6%E3%81%AE%E3%81%9F%E3%82%81%E3%81%AE%E5%9B%A0%E6%9E%9C%E6%8E%A8%E8%AB%96I-%E2%80%95%E4%B8%80%E8%88%AC%E5%8C%96%E7%B7%9A%E5%9E%8B%E3%83%A2%E3%83%87%E3%83%AB%E2%80%95-%E7%94%B0%E4%B8%AD-%E5%8F%B8%E6%9C%97/dp/4254122705/ref=sr_1_1?__mk_ja_JP=%E3%82%AB%E3%82%BF%E3%82%AB%E3%83%8A&amp;keywords=%E5%8C%BB%E5%AD%A6%E3%81%AE%E3%81%9F%E3%82%81%E3%81%AE%E5%9B%A0%E6%9E%9C%E6%8E%A8%E8%AB%96&amp;qid=1691454875&amp;sr=8-1">医学のための因果推論I</a>, p51）</p>
<p>特に気をつけていただきたいのは、<a href="https://best-biostatistics.com/hypo_test/num-subject.html">サンプルサイズ</a>が小さい時には、p値の確率的変動は不安定で、到底信頼できるものではないということ。</p>
<p>仮説検定の目標は、<a href="https://best-biostatistics.com/hypo_test/error.html">αエラーとβエラーを制御すること</a>であって、適切なサンプルサイズ設計がなされていることが前提。</p>
<p><span class="marker"><strong>医学研究では、p値はデータの要約指標という観点で扱うのがよく、その意味では推定値や信頼区間など大差ないのだから、特別扱いすべきではありません</strong></span>。</p>
<p>むしろ、信頼区間の方が情報量が多く、データを理解するために役立つ指標です。</p>
<p>&nbsp;</p>
<h2>P値に関するまとめ</h2>
<p><img decoding="async" class="aligncenter wp-image-2527 size-full" src="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/ec17114ba3d7d829dcd97f397b8c1421_s-e1577088691586.jpg" alt="P値に関するまとめ" width="640" height="334" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/ec17114ba3d7d829dcd97f397b8c1421_s-e1577088691586.jpg 640w, https://best-biostatistics.com/wp/wp-content/uploads/2019/10/ec17114ba3d7d829dcd97f397b8c1421_s-e1577088691586-300x157.jpg 300w" sizes="(max-width: 640px) 100vw, 640px" /></p>
<p>P値は帰無仮説下で、その結果以上（以下）が出る確率である。</p>
<p>つまり、帰無仮説下での確率が<a href="https://best-biostatistics.com/hypo_test/significant.html">有意水準の0.05</a>を下回った場合、帰無仮説を考えていることが間違っているのではないかと判断して棄却し、対立仮説を採択する。</p>
<p>&nbsp;</p>
<p>P値に関して動画で解説しています。</p>
<p>ぜひブログ記事を併せて確認してみてください。</p>
<p style="text-align: center;"><iframe src="https://www.youtube.com/embed/E3xI5TMMwOc" width="560" height="315" frameborder="0" allowfullscreen="allowfullscreen" data-mce-fragment="1"></iframe></p>
]]></content:encoded>
					
					<wfw:commentRss>https://best-biostatistics.com/hypo_test/p-value.html/feed</wfw:commentRss>
			<slash:comments>1</slash:comments>
		
		
			</item>
	</channel>
</rss>
