<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>0.05 &#8211; いちばんやさしい、医療統計</title>
	<atom:link href="https://best-biostatistics.com/tag/0-05/feed" rel="self" type="application/rss+xml" />
	<link>https://best-biostatistics.com</link>
	<description>数式にとらわれない、イメージとしての統計！</description>
	<lastBuildDate>Mon, 24 Feb 2025 23:02:52 +0000</lastBuildDate>
	<language>ja</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	<generator>https://wordpress.org/?v=6.9.4</generator>

<image>
	<url>https://best-biostatistics.com/wp/wp-content/uploads/2024/04/cropped-Data-Seed-Inc.-logo-I-32x32.png</url>
	<title>0.05 &#8211; いちばんやさしい、医療統計</title>
	<link>https://best-biostatistics.com</link>
	<width>32</width>
	<height>32</height>
</image> 
<atom:link rel="hub" href="https://pubsubhubbub.appspot.com"/>
<atom:link rel="hub" href="https://pubsubhubbub.superfeedr.com"/>
<atom:link rel="hub" href="https://websubhub.com/hub"/>
<atom:link rel="self" href="https://best-biostatistics.com/tag/0-05/feed"/>
	<item>
		<title>サンプルサイズの決め方は？臨床研究で統計的な検出力を保持する計算式</title>
		<link>https://best-biostatistics.com/hypo_test/num-subject.html</link>
					<comments>https://best-biostatistics.com/hypo_test/num-subject.html#comments</comments>
		
		<dc:creator><![CDATA[beat1115]]></dc:creator>
		<pubDate>Mon, 24 Feb 2025 23:00:43 +0000</pubDate>
				<category><![CDATA[統計学的検定の基礎]]></category>
		<category><![CDATA[0.05]]></category>
		<category><![CDATA[P値]]></category>
		<category><![CDATA[有意水準]]></category>
		<category><![CDATA[統計学的検定]]></category>
		<guid isPermaLink="false">http://best-biostatistics.com/wp/2016/02/07/num-subject/</guid>

					<description><![CDATA[<p><img src="https://best-biostatistics.com/wp/wp-content/uploads/2016/02/screenshot-2019-05-07-1.35.49.png" class="webfeedsFeaturedVisual" /></p>検定とは何でしょうか？P値と有意水準の違いは？結果が良ければそれは真実？
検定の便利な点と、安易に検定をする怖さを解説します。
]]></description>
										<content:encoded><![CDATA[<p><img src="https://best-biostatistics.com/wp/wp-content/uploads/2016/02/screenshot-2019-05-07-1.35.49.png" class="webfeedsFeaturedVisual" /></p>
<p>突然ですが、臨床研究での<span style="color: #ff0000;"><strong>サンプルサイズの決め方を知っていますか？</strong></span></p>



<p>統計学的検定をする際にとても重要なこと。</p>



<p>それが、<strong>サンプルサイズを事前に決めること</strong>です。</p>



<p>なぜかというと、統計学的検定とは、事前に<a href="https://best-biostatistics.com/hypo_test/power.html">検出力</a>を保った上で検定する必要があるから。</p>



<p>そうでなければ、<strong>いくら<a href="https://best-biostatistics.com/hypo_test/significant.html">P値が0.05を下回ったところで、有意差が出たというその結果は「たまたま」にしか過ぎない</a></strong>からです。</p>



<p>今回の記事では、なぜサンプルサイズを決めなければならないのか、そして、サンプルサイズを決めるには何を意識すれば良いのか、論文の書き方についてお伝えします。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">臨床研究でのサンプルサイズの決め方は？なぜ必要症例数は事前に決めなければならないの？</h2>


<div class="wp-block-image">
<figure class="aligncenter"><img decoding="async" width="640" height="323" src="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/7f418be16ff229275d0670150ea529e0_s-e1577088780405.jpg" alt="サンプルサイズの決め方は？なぜ必要症例数は事前に決めなければならないの？" class="wp-image-2528" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/7f418be16ff229275d0670150ea529e0_s-e1577088780405.jpg 640w, https://best-biostatistics.com/wp/wp-content/uploads/2019/10/7f418be16ff229275d0670150ea529e0_s-e1577088780405-300x151.jpg 300w" sizes="(max-width: 640px) 100vw, 640px" /></figure>
</div>


<p>サンプルサイズは、事前に決める必要があることをお伝えしました。</p>



<p>しかし、<span style="color: #ff0000;"><strong>なぜ事前に決めなければならないのか？という疑問が出てきます</strong></span>よね。</p>



<p>そのために、T検定を例にしてなぜ事前に決めなければならないのかを解説します。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading">サンプルサイズが大きいとP値が小さくなる：T検定を例にして計算式を理解する</h3>



<p><a href="https://best-biostatistics.com/stat-test/t-test.html" target="_blank" rel="noopener noreferrer">T検定でやっていること</a>は、以下の4つの手順です。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<ol class="wp-block-list">
<li><strong>プラセボ群や実薬群の平均値、標準偏差を算出する</strong></li>



<li><strong>T統計量を算出する</strong></li>



<li><strong>P値を算出する（T統計量が大きいと、P値は小さくなる）</strong></li>



<li><strong><a href="https://best-biostatistics.com/hypo_test/significant.html" target="_blank" rel="noopener noreferrer">P値が有意水準（α=0.05）を下回っているかどうかを判断</a>する</strong></li>
</ol>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>この時、T統計量がどんな計算式で求められるかを確認してみます。</p>



<p>T統計量とは、以下の式です。（Nがサンプルサイズ、SDが標準偏差を示しています）</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>


<div class="wp-block-image">
<figure class="aligncenter"><img decoding="async" width="414" height="107" src="https://best-biostatistics.com/wp/wp-content/uploads/2016/02/スクリーンショット-2019-05-07-00.42.15.png" alt="サンプルサイズの計算式" class="wp-image-1383" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2016/02/スクリーンショット-2019-05-07-00.42.15.png 414w, https://best-biostatistics.com/wp/wp-content/uploads/2016/02/スクリーンショット-2019-05-07-00.42.15-300x78.png 300w, https://best-biostatistics.com/wp/wp-content/uploads/2016/02/スクリーンショット-2019-05-07-00.42.15-375x97.png 375w" sizes="(max-width: 414px) 100vw, 414px" /></figure>
</div>


<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>この時、プラセボ群のSDと被験薬群のSDが同じと仮定し、式展開してみます。</p>



<p>すると、以下のような式になります。</p>


<div class="wp-block-image">
<figure class="aligncenter"><img decoding="async" width="701" height="118" src="https://best-biostatistics.com/wp/wp-content/uploads/2016/02/スクリーンショット-2019-05-07-00.44.46.png" alt="サンプルサイズの計算式" class="wp-image-1385" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2016/02/スクリーンショット-2019-05-07-00.44.46.png 701w, https://best-biostatistics.com/wp/wp-content/uploads/2016/02/スクリーンショット-2019-05-07-00.44.46-300x50.png 300w, https://best-biostatistics.com/wp/wp-content/uploads/2016/02/スクリーンショット-2019-05-07-00.44.46-375x63.png 375w" sizes="(max-width: 701px) 100vw, 701px" /></figure>
</div>


<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>この式を見ると、3つのことに気づきます。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<ol class="wp-block-list">
<li><strong>サンプルサイズ（N）を大きくすると、<a href="https://best-biostatistics.com/stat-test/toukeiryou.html">T統計量</a>が大きくなる（つまり、P値が小さくなる）</strong></li>



<li><strong>群間の差が大きいと、T統計量が大きくなる（つまり、P値が小さくなる）</strong></li>



<li><strong>標準偏差（SD）が小さいと、T統計量が大きくなる（つまり、P値が小さくなる）</strong></li>
</ol>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>そう、P値が小さくなる要素は、群間の差が大きいだけじゃないんです。</p>



<p><span class="marker"><strong>サンプルサイズが大きくても、P値は小さくなります</strong></span>。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading">サンプルサイズを事前に決めないとなぜP値が小さくなったかわからなくなる</h3>



<p>そのため、サンプルサイズを事前に決めなかった場合に、有意差が出た時。</p>



<p>2つの解釈ができることになります。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<ol class="wp-block-list">
<li><strong>群間の差が大きくてP値が小さくなった可能性</strong></li>



<li><strong>サンプルサイズが大きくてP値が小さくなった可能性</strong></li>
</ol>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p><strong>私たちが得たいのは、1の「群間の差が大きくてP値が小さくなった」という結果</strong>です。</p>



<p>しかしながら、<span style="color: #ff0000;"><strong>サンプルサイズを事前に決めておかないと、P値が小さくなった要因が「群間差がある」と「サンプルサイズが大きい」の2つの可能性が残ってしまうことになってしまう</strong></span>のです。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>そのため、サンプルサイズを事前に決める理由をまとめます。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<div class="ep-box es-BsubTradi bgc-white es-borderSolidM es-radius brc-DPred" title="サンプルサイズを事前に決める理由"><span style="font-size: 14pt;"><strong>P値が小さくなった時に、「群間差があってP値が小さくなった」のか「サンプルサイズが大きいためにP値が小さくなったのか」の2つの可能性が残ってしまうため</strong></span></div>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>これはぜひ理解してください。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">サンプルサイズの決め方は？検出力を確保するために考えること</h2>


<div class="wp-block-image">
<figure class="aligncenter"><img decoding="async" width="640" height="340" src="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/2ae4ec48eb55ae189560e8bb40caa89f_s-e1577089193118.jpg" alt="サンプルサイズの決め方は？検出力を確保するために考えること" class="wp-image-2529" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/2ae4ec48eb55ae189560e8bb40caa89f_s-e1577089193118.jpg 640w, https://best-biostatistics.com/wp/wp-content/uploads/2019/10/2ae4ec48eb55ae189560e8bb40caa89f_s-e1577089193118-300x159.jpg 300w" sizes="(max-width: 640px) 100vw, 640px" /></figure>
</div>


<p>サンプルサイズを事前に決めておく重要性を理解しました。</p>



<p>ということで、サンプルサイズの決め方です。</p>



<p>サンプルサイズを決めるためには、<span style="color: #ff0000;"><strong>4つを決める必要があります</strong></span>。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<ol class="wp-block-list">
<li><strong>群間の効果の差</strong></li>



<li><strong>ばらつき</strong></li>



<li><a href="https://best-biostatistics.com/hypo_test/error.html" target="_blank" rel="noopener noreferrer"><strong>αエラー</strong></a></li>



<li><a href="https://best-biostatistics.com/hypo_test/error.html" target="_blank" rel="noopener noreferrer"><strong>βエラー</strong></a></li>
</ol>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>逆にいうと、上記の4つを決めてしまえばサンプルサイズは自動で決まります。</p>



<p>そのため、この4つに症例数を加えた5つを五角形に見立てて、<strong>症例数を決めるペンタゴン</strong>という場合があります。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>


<div class="wp-block-image">
<figure class="aligncenter"><img decoding="async" width="525" height="296" src="https://best-biostatistics.com/wp/wp-content/uploads/2016/02/shoureisuu.png" alt="サンプルサイズの決め方は？検出力を確保するために考えること" class="wp-image-393" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2016/02/shoureisuu.png 525w, https://best-biostatistics.com/wp/wp-content/uploads/2016/02/shoureisuu-300x169.png 300w" sizes="(max-width: 525px) 100vw, 525px" /></figure>
</div>


<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading">サンプルサイズが変動する要因は？検出力を保つために</h3>



<p>群間の効果の差、ばらつき、αエラー、βエラーの4つを動かせば、サンプルサイズが変動することがわかりました。</p>



<p>では、各4つの要素をどう動かすと、サンプルサイズが多くなるか、を見てみます。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<figure class="wp-block-image"><img decoding="async" width="683" height="388" src="https://best-biostatistics.com/wp/wp-content/uploads/2016/02/screenshot-1.png" alt="サンプルサイズが変動する要因は？検出力を保つために" class="wp-image-1387" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2016/02/screenshot-1.png 683w, https://best-biostatistics.com/wp/wp-content/uploads/2016/02/screenshot-1-300x170.png 300w, https://best-biostatistics.com/wp/wp-content/uploads/2016/02/screenshot-1-375x213.png 375w" sizes="(max-width: 683px) 100vw, 683px" /></figure>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<ol class="wp-block-list">
<li><strong>群間の効果の差が小さいと、サンプルサイズは多くなる</strong></li>



<li><strong>ばらつきが大きいと、サンプルサイズは多くなる</strong></li>



<li><strong>αエラーが小さいと、サンプルサイズは多くなる</strong></li>



<li><strong>βエラーが小さい（<a href="https://best-biostatistics.com/hypo_test/power.html">検出力</a>が大きい）と、サンプルサイズは多くなる</strong></li>
</ol>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>このような動きになります。</p>



<p>上記の4つの動きに関しては、絶対に覚えておきましょう。</p>



<p>丸暗記でもいいぐらいです。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>ちなみに、βエラーに関しては、検出力で表現する場合があります。</p>



<p><strong>検出力とは（1-βエラー）で表現できるため、βエラーが小さいというのは、検出力が大きい、と等しいことです</strong>。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading">サンプルサイズの決め方は、薬の開発状況によって変わる</h3>



<p>サンプルサイズを決めるのは、群間の効果の差、ばらつき、αエラー、βエラーの4つでした。</p>



<p>そして、それぞれが変化すると、サンプルサイズが大きくなったり小さくなったりします。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>では、開発費用や開発期間が限られた中で、サンプルサイズをできるだけ小さくするには、どこをどうすれば良いでしょうか？</p>



<p>それは、その<strong>薬の開発状況に応じて変化させる必要があります</strong>。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p><a href="https://best-biostatistics.com/biostat/piii.html" target="_blank" rel="noopener noreferrer">第III相試験であれば、αエラーは5%以下にしなければならないと明確に決まっているため、αエラーを変えることが出来ません</a>。</p>



<p>しかし<a href="https://best-biostatistics.com/biostat/piii.html" target="_blank" rel="noopener noreferrer">第II相試験であれば、企業リスクを受け入れる形で、αエラーを10%にしてみることも可能</a>です。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>ですがやはり一番に考えるのは、薬効の効果の差と、そのばらつきを変えることが出来ないか？ということです。</p>



<p><strong>薬効の効果の差を大きくするためには、試験に組み入れる患者を、薬剤が効く集団に限定するように、組み入れ基準や除外基準を決める</strong>ということを考えます。</p>



<p>しかし、薬が効く集団だけで試験をするとなると、<a href="https://best-biostatistics.com/biostat/boshuudan.html" target="_blank" rel="noopener noreferrer">母集団がどこになるのか</a>、そして<a href="https://best-biostatistics.com/design/ippannka.html" target="_blank" rel="noopener noreferrer">一般化可能性を考える必要があります</a>。</p>



<p>そうして限定された集団で試験をすると、薬として発売されたとしても投与できる集団が限定されて、結局売り上げが伸びないといったことにつながる可能性が出てきます。</p>



<p>このように、開発コストの面と、一般化可能性の面を天秤に掛けて、常に試験の集団を考えなければいけません。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">論文にもサンプルサイズをMethodに記載する。書き方は？</h2>



<p>サンプルサイズが事前に決まっているかどうか、<a href="https://best-biostatistics.com/review/publication-read.html">論文ではMethodを読む</a>ことで確認することが出来ます。</p>



<p>ここでサンプルサイズのことが書いていない論文については、どれだけ素晴らしい結果（P値が小さい結果）であろうと、たまたま出た結果であることが否定できません。</p>



<p>つまり、その試験をもう一度実施したら、全く違った結果が出る可能性があるということです。</p>



<p>なぜなら、前述の通り、<span class="marker">本当に薬に効果があったためにP値が小さくなったのか、サンプルサイズが大きかったためにP値が小さくなったのかが分からないためです</span>。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>そして、あなたの研究でもサンプルサイズを記載する必要があります。</p>



<p>サンプルサイズの論文への書き方に関しては、他の論文を参考にすることでOK。</p>



<p>例えば、こちらの論文を見てみます。</p>



<figure class="wp-block-image size-full is-resized"><img decoding="async" width="870" height="416" src="https://best-biostatistics.com/wp/wp-content/uploads/2022/03/ScreenShot-2025-02-25-7.50.17.png" alt="" class="wp-image-7951" style="width:852px;height:auto" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2022/03/ScreenShot-2025-02-25-7.50.17.png 870w, https://best-biostatistics.com/wp/wp-content/uploads/2022/03/ScreenShot-2025-02-25-7.50.17-300x143.png 300w, https://best-biostatistics.com/wp/wp-content/uploads/2022/03/ScreenShot-2025-02-25-7.50.17-768x367.png 768w" sizes="(max-width: 870px) 100vw, 870px" /></figure>



<p class="has-text-align-right"><strong><a href="DOI: 10.1056/NEJMoa2203094">DOI: 10.1056/NEJMoa2203094</a></strong></p>



<p>Methodを見ると、下記のようなサンプルサイズ計算の記載があります。</p>



<p class="has-border -border01">We estimated that 25% of the patients in the acetazolamide group would have successful decongestion within 3 days after randomization; 25% was chosen to represent a clear, meaningful absolute benefit of 10 percentage points as compared with placebo. Assuming a two-sided alpha of 0.05 and a statistical power of 80%, we calculated the targeted sample size for the trial to be 494, and to account for a potential withdrawal of 5% of the patients, we calculated that the trial would need to enroll 519 patients.</p>



<p>サンプルサイズ計算をしていれば、その通りに記載すればいいのですが、<a href="https://best-biostatistics.com/what_is_clinicaltrial/tansaku-kenshou.html" data-type="post" data-id="5958">探索的な研究</a>の場合には事前にサンプルサイズ計算をしていない場合もあるはず。</p>



<p>事前にサンプルサイズ計算をしていない場合でも、Methodにはその旨を記載します。</p>



<p>例えばこちらの論文を参考にしてみます。</p>



<figure class="wp-block-image size-full"><img decoding="async" width="674" height="260" src="https://best-biostatistics.com/wp/wp-content/uploads/2022/03/ScreenShot-2025-02-25-7.55.16.png" alt="" class="wp-image-7952" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2022/03/ScreenShot-2025-02-25-7.55.16.png 674w, https://best-biostatistics.com/wp/wp-content/uploads/2022/03/ScreenShot-2025-02-25-7.55.16-300x116.png 300w" sizes="(max-width: 674px) 100vw, 674px" /></figure>



<p class="has-text-align-right"><a href="https://doi.org/10.1111/bjd.14207">https://doi.org/10.1111/bjd.14207</a></p>



<p>Methodを見ると、下記のようなサンプルサイズ計算の記載があります。</p>



<p class="has-border -border01">No statistical sample size calculations were conducted. However, a sample size of nine patients per group gave post hoc powers of 43%, 40% and 31% to detect differences in mean of 30%, 29% and 25%, respectively, for pruritus VAS score at week 4, assuming a common SD of 33%, using a two‐group <em>t</em>‐test with a two‐sided significance level of <em>P</em> &lt; 0·05 for percentage change from baseline between placebo and each active group.</p>



<p>最初に「No statistical sample size calculations were conducted.」と、潔く記載していることがわかります。</p>



<p>そして、事前にサンプルサイズ計算をしていない代わりに、<a href="https://best-biostatistics.com/hypo_test/power.html" data-type="post" data-id="5152">事後的な検出力</a>を計算して記載しています。</p>



<p>このような書き方もOKです。</p>



<p>＞＞<a href="https://best-biostatistics.com/ezr/ezr-power.html" data-type="post" data-id="5139">EZRで検出力計算をするには？</a></p>



<h3 class="wp-block-heading">サンプルサイズの重要性：統計的に有意な差と、臨床的に意味のある差は違うことを理解する</h3>



<p>サンプルサイズが大きくなると、P値が小さくなることを学びました。</p>



<p>この事実を知っていると、<strong>「統計的に有意な差」と「臨床的に意味のある差」は異なる</strong>ということがわかります。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>私は豊富な資金と期間があれば、どんなデータにでも有意な差を付けることが出来ます。</p>



<p>例えば、東京都の20歳と神奈川県の20歳の収縮期血圧に有意な差をつけることも可能です。</p>



<p>それが例え1mmHgの差であったとしてもです。</p>



<p>1万人ずつ被験者さんがいれば、1mmHgの差で統計的な有意差を付けることが出来ます。</p>



<p>でも、考えてみてください。収縮期血圧の1mmHgの差は、臨床的にどれだけ意味のある差でしょうか？</p>



<p>同じ人でも血圧を2回測定したら、それだけで1mmHgの違いなんて簡単に出てきます。</p>



<p>まったく臨床的に意味はない差ですよね。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>そのため臨床研究を行う私たちが気にしなければいけないことは、<strong><span style="color: #ff0a0a;">臨床的に意味のある差を統計学的に検出できているのか？</span></strong>ということです。</p>



<p>この視点がない限り、統計は単なる数値のお遊びでしかなくなります。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>ぜひ論文を読む際にも、<strong><span class="marker">統計学的に差がつけられたこの数値は、臨床的に意味のある差なのか？</span></strong>という観点で読んでみてください。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">サンプルサイズに関するまとめ</h2>


<div class="wp-block-image">
<figure class="aligncenter"><img decoding="async" width="640" height="334" src="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/ec17114ba3d7d829dcd97f397b8c1421_s-e1577088691586.jpg" alt="サンプルサイズに関するまとめ" class="wp-image-2527" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/ec17114ba3d7d829dcd97f397b8c1421_s-e1577088691586.jpg 640w, https://best-biostatistics.com/wp/wp-content/uploads/2019/10/ec17114ba3d7d829dcd97f397b8c1421_s-e1577088691586-300x157.jpg 300w" sizes="(max-width: 640px) 100vw, 640px" /></figure>
</div>


<p>統計的検定を厳密に実施するためには、事前にサンプルサイズを決める必要がある。</p>



<p>サンプルサイズを決めずに得た検定結果は、、本当に薬に効果があったためにP値が小さくなったのか、サンプルサイズが大きかったためにP値が小さくなったのかが分からない。</p>



<p>サンプルサイズを決めるのは、群間の効果の差、ばらつき、αエラー、βエラーの4つである。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>＞＞<a href="https://best-biostatistics.com/ezr/ezr-samplenum.html">EZRでサンプルサイズを計算する方法</a></p>



<p>＞＞<a href="https://best-biostatistics.com/jmp/jmp-sample-size.html">JMPでサンプルサイズを計算する方法</a></p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>統計に関するご質問があれば、メルマガにご登録の上ご質問くださいませ！</p>



<p>＞＞<a href="https://best-biostatistics.com/lp2/seo/">メルマガ登録はこちら（無料プレゼントあります。）</a></p>
]]></content:encoded>
					
					<wfw:commentRss>https://best-biostatistics.com/hypo_test/num-subject.html/feed</wfw:commentRss>
			<slash:comments>6</slash:comments>
		
		
			</item>
		<item>
		<title>ノンパラメトリック検定とパラメトリック検定とは？意味や種類をわかりやすく</title>
		<link>https://best-biostatistics.com/hypo_test/para.html</link>
					<comments>https://best-biostatistics.com/hypo_test/para.html#comments</comments>
		
		<dc:creator><![CDATA[beat1115]]></dc:creator>
		<pubDate>Fri, 25 Oct 2024 00:00:53 +0000</pubDate>
				<category><![CDATA[統計学的検定の基礎]]></category>
		<category><![CDATA[0.05]]></category>
		<category><![CDATA[P値]]></category>
		<category><![CDATA[有意水準]]></category>
		<category><![CDATA[統計学的検定]]></category>
		<guid isPermaLink="false">http://best-biostatistics.com/wp/2016/02/07/para/</guid>

					<description><![CDATA[<p><img src="https://best-biostatistics.com/wp/wp-content/uploads/2016/02/スクリーンショット-2018-10-14-10.49.32.png" class="webfeedsFeaturedVisual" /></p>検定とは何でしょうか？P値と有意水準の違いは？結果が良ければそれは真実？
検定の便利な点と、安易に検定をする怖さを解説します。
]]></description>
										<content:encoded><![CDATA[<p><img src="https://best-biostatistics.com/wp/wp-content/uploads/2016/02/スクリーンショット-2018-10-14-10.49.32.png" class="webfeedsFeaturedVisual" /></p>
<p>統計的検定を勉強していると、必ず出てくる「パラメトリック検定」と「ノンパラメトリック検定」。</p>



<p>T検定はパラメトリック検定で、ウィルコクソン順位和検定はノンパラメトリック検定です、と教科書に書いてあります。</p>







<p>・・・で、その２つの違いは何？</p>



<p>ってなりますよね。</p>



<p>今回の記事では、「パラメトリック検定」と「ノンパラメトリック検定」の意味や検定の種類に関して、例を交えてわかりやすく簡単に説明します。</p>







<h2 class="wp-block-heading">パラメトリック検定とはどんな意味なの？</h2>


<div class="wp-block-image">
<figure class="aligncenter"><img decoding="async" width="640" height="340" src="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/2ae4ec48eb55ae189560e8bb40caa89f_s-e1577089193118.jpg" alt="パラメトリック検定とはどんな意味なの？" class="wp-image-2529" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/2ae4ec48eb55ae189560e8bb40caa89f_s-e1577089193118.jpg 640w, https://best-biostatistics.com/wp/wp-content/uploads/2019/10/2ae4ec48eb55ae189560e8bb40caa89f_s-e1577089193118-300x159.jpg 300w" sizes="(max-width: 640px) 100vw, 640px" /></figure>
</div>






<p>パラメトリック検定というのは、<span style="color: #ff0000;"><strong>「事前にデータの分布を仮定している検定」</strong></span>になります。</p>



<p>例えば、<a href="https://best-biostatistics.com/stat-test/t-test.html" target="_blank" rel="noopener noreferrer">パラメトリック検定で一番有名なT検定</a>。</p>



<p><a href="https://best-biostatistics.com/stat-test/t-test.html" target="_blank" rel="noopener noreferrer"><strong>T検定の場合、データは正規分布に従っていることが前提</strong></a>になります。</p>







<p><a href="https://best-biostatistics.com/summary/normal_dist.html">正規分布</a>は、<a href="https://best-biostatistics.com/summary/diff-mean-median.html">平均値</a>と<a href="https://best-biostatistics.com/summary/sd-variance.html">標準偏差</a>が決まればその形が決まります。</p>



<p>言い換えると、<a href="https://best-biostatistics.com/summary/diff-mean-median.html">平均値</a>と<a href="https://best-biostatistics.com/summary/sd-variance.html">標準偏差</a>が正規分布の形を決める重要な要素です。</p>



<p>正規分布における平均値と標準偏差のように、<strong><span class="marker">分布を決める時の重要な要素を、パラメータと呼びます</span></strong>。</p>



<p>そのため、<span class="marker">「平均値と標準偏差は、正規分布のパラメータである」</span>と言うことができます。</p>







<p>T検定がやっていることは、二つの正規分布がどれぐらい離れているのか？を調べているということ。</p>



<p>この特性から、一つ言えることがあります。</p>







<div class="pointBox">
<p><span style="color: #ff0000;"><strong>T検定は、正規分布に従っていないデータでは、有意になりにくい。</strong></span></p>
</div>



<p>もう少し具体的に言うと、<span style="color: #ff0000;"><strong>外れ値があった場合に、T検定は有意になりにくい</strong></span>です。</p>







<p>平均値は<a href="https://best-biostatistics.com/summary/outlier.html" target="_blank" rel="noopener noreferrer">外れ値</a>にかなり影響を受けます。</p>



<p>そして、計算式の中で平均値を使っている標準偏差も、<a href="https://best-biostatistics.com/summary/outlier.html" target="_blank" rel="noopener noreferrer">外れ値</a>にかなり影響を受けます。</p>







<h3 class="wp-block-heading">パラメトリック検定を用いるのがふさわしい場面</h3>



<p>パラメトリック検定は、事前にデータの分布を知っている必要があります。</p>



<p>つまり、パラメトリック検定を用いたい場面は「すでに多くの研究でデータの分布がある程度わかっている場合」です。</p>







<p>例えば、身長や体重などは正規分布に従う事が知られています。</p>



<p>ということは、<a href="https://best-biostatistics.com/stat-test/t-test.html" target="_blank" rel="noopener noreferrer">身長や体重の平均値を比較する時には、パラメトリック検定であるT検定を使えば問題ありません</a>。</p>







<h2 class="wp-block-heading">ノンパラメトリック検定とはどんな意味なの？</h2>


<div class="wp-block-image">
<figure class="aligncenter"><img decoding="async" width="640" height="350" src="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/f3ff2b38f21bcd8da977db80ed2a0e7e_s-e1577089044626.jpg" alt="ノンパラメトリック検定とはどんな意味なの？" class="wp-image-2531" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/f3ff2b38f21bcd8da977db80ed2a0e7e_s-e1577089044626.jpg 640w, https://best-biostatistics.com/wp/wp-content/uploads/2019/10/f3ff2b38f21bcd8da977db80ed2a0e7e_s-e1577089044626-300x164.jpg 300w" sizes="(max-width: 640px) 100vw, 640px" /></figure>
</div>






<p>ノンパラメトリック検定とは、パラメトリックじゃない検定です。</p>



<p>つまり、<span class="marker">「事前にデータの分布を仮定しない検定」</span>になります。</p>



<p>例えば、<a href="https://best-biostatistics.com/stat-test/w-test.html" target="_blank" rel="noopener noreferrer">ウィルコクソンの順位和検定というのが、ノンパラメトリック検定の一つ</a>になります。</p>



<p>この場合、<strong>データがどんな分布（正規分布や対数正規分布など、何でも）であっても、有意になりやすさというのは同じ</strong>になります。</p>







<p>有意になりやすさを表にしてみるとこんな感じです。<br><!-- ★テーブルタグここから★ --></p>







<figure class="wp-block-table"><table class="has-fixed-layout"><tbody><tr><td>データの分布</td><td>T検定（パラメトリック）</td><td>ウィルコクソンの順位和検定（ノンパラメトリック）</td></tr><tr><td>正規分布</td><td>◎</td><td>◯</td></tr><tr><td>正規分布ではない</td><td>×</td><td>◯</td></tr></tbody></table></figure>







<p>注目したいのは、ウィルコクソンの順位和検定のオールマイティな性質です。</p>



<p>データが正規分布であっても、正規分布でなくとも、有意になりやすさが一定です。</p>







<h3 class="wp-block-heading">ノンパラメトリック検定の利点は？こんな時に使いやすい例</h3>



<p>ノンパラメトリック検定は「事前にデータの分布を考慮しなくても良い」という点でとても便利です。</p>



<p>身長や体重など、すでにそのデータの分布がわかっているデータに関しては、パラメトリックな検定をすればOKです。</p>







<p>しかしながら、例えば<strong><span class="marker">新規に作成したアンケートのデータなど、事前にデータがどのような分布になっているのかが想像もできない、というデータも世の中には存在します</span></strong>。</p>



<p>その場合には、ノンパラメトリック検定を実施する事がオススメ。</p>







<h2 class="wp-block-heading">ノンパラメトリック検定とパラメトリック検定ではどっちを使えばいいの？使い分けの判断は？</h2>



<p>ではパラメトリック検定とノンパラメトリック検定の、どちらを使えばよいか？というのが疑問になると思います。</p>



<p>ですが、そこには答えはありません。</p>



<p>大事な考え方は、<strong>「母集団がどのような分布になるか」を考えて決める</strong>ということです。</p>



<p>決して「得られたデータに一番フィットするという考え方で検定方法を決めてはいけない」のが重要です。</p>







<p>例えば、身長や体重などは正規分布に従うことが知られています。</p>



<p>そのため、今回の研究で得られているデータが正規分布っぽくなさそうでも、それはたまたまであると考えられ、母集団のデータは正規分布である、と考えることができます。</p>



<p>そのため、パラメトリック検定であるT検定を用いても、その解析手法は間違っているとは言えないのです。</p>







<h2 class="wp-block-heading">ノンパラメトリック検定とパラメトリック検定まとめ</h2>


<div class="wp-block-image">
<figure class="aligncenter"><img decoding="async" width="640" height="334" src="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/ec17114ba3d7d829dcd97f397b8c1421_s-e1577088691586.jpg" alt="ノンパラメトリック検定とパラメトリック検定まとめ" class="wp-image-2527" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/ec17114ba3d7d829dcd97f397b8c1421_s-e1577088691586.jpg 640w, https://best-biostatistics.com/wp/wp-content/uploads/2019/10/ec17114ba3d7d829dcd97f397b8c1421_s-e1577088691586-300x157.jpg 300w" sizes="(max-width: 640px) 100vw, 640px" /></figure>
</div>






<p>パラメトリック検定とノンパラメトリック検定の違いは、「事前にデータの分布を仮定しているかどうか」の違いです。</p>



<p>パラメトリック検定はデータの分布を仮定するため、すでにたくさんの研究がされてデータの分布がわかっている場合に有用です。</p>



<p>またノンパラメトリック検定は、アンケート調査など、新規にデータを取得する場合に特に有効です。</p>



<p class="border1"></p>




]]></content:encoded>
					
					<wfw:commentRss>https://best-biostatistics.com/hypo_test/para.html/feed</wfw:commentRss>
			<slash:comments>7</slash:comments>
		
		
			</item>
		<item>
		<title>片側検定と両側検定の違いや使い分けは？有意水準や棄却域はどう設定？</title>
		<link>https://best-biostatistics.com/hypo_test/one-way.html</link>
					<comments>https://best-biostatistics.com/hypo_test/one-way.html#comments</comments>
		
		<dc:creator><![CDATA[beat1115]]></dc:creator>
		<pubDate>Sun, 11 Aug 2024 04:00:50 +0000</pubDate>
				<category><![CDATA[統計学的検定の基礎]]></category>
		<category><![CDATA[0.05]]></category>
		<category><![CDATA[P値]]></category>
		<category><![CDATA[有意水準]]></category>
		<category><![CDATA[統計学的検定]]></category>
		<guid isPermaLink="false">http://best-biostatistics.com/wp/2016/02/07/one-way/</guid>

					<description><![CDATA[<p><img src="https://best-biostatistics.com/wp/wp-content/uploads/2023/04/データシード_YouTubeサムネイル-1024x576.png" class="webfeedsFeaturedVisual" /></p>統計学的検定を勉強していくと、「片側検定」と「両側検定」という用語に出会います。

あなたはこの「片側検定と両側検定の違い」を説明できますか？

違いを一言でいうと、「興味のある方向が1つだけかそうじゃないか」ということです。

…おそらく、これだけでは何のことかわかりませんね。

今回の記事は、そんな片側検定と両側検定の違いについて。

有意水準や棄却域の設定方法に関しても解説します。]]></description>
										<content:encoded><![CDATA[<p><img src="https://best-biostatistics.com/wp/wp-content/uploads/2023/04/データシード_YouTubeサムネイル-1024x576.png" class="webfeedsFeaturedVisual" /></p>
<p>統計学的検定を勉強していくと、「片側検定」と「両側検定」という用語に出会います。</p>



<p>あなたはこの「片側検定と両側検定の違い」を説明できますか？</p>



<p>違いを一言でいうと、「<strong><span class="marker">興味のある方向が1つだけかそうじゃないか</span></strong>」ということです。</p>



<p>…おそらく、これだけでは何のことかわかりませんね。</p>



<p>今回の記事は、そんな片側検定と両側検定の違いについて。</p>



<p>有意水準や棄却域の設定方法に関しても解説します。</p>







<h2 class="wp-block-heading">片側検定と両側検定の違いや使い分けは？</h2>


<div class="wp-block-image">
<figure class="aligncenter"><img decoding="async" width="640" height="345" src="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/987eca87017b5f2fa265f89558d4724a_s-e1577496841202.jpg" alt="片側検定と両側検定の違いや使い分けは？" class="wp-image-2530" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/987eca87017b5f2fa265f89558d4724a_s-e1577496841202.jpg 640w, https://best-biostatistics.com/wp/wp-content/uploads/2019/10/987eca87017b5f2fa265f89558d4724a_s-e1577496841202-300x162.jpg 300w" sizes="(max-width: 640px) 100vw, 640px" /></figure>
</div>






<p>片側検定と両側検定の違いに関して、コイン投げを例にして考えてみます。</p>



<p>例えばコインを100回、投げることにします。</p>



<p>その時に、「<strong>表が出る回数</strong>が極端に多いかどうか」に興味があって、それを検定する場合には片側検定になります。</p>



<p>そうではなく、「<strong>表か裏の、どちらかが出る回数</strong>が極端に多いかどうか」に興味があったとして、それを検定する場合には両側検定になります。</p>







<p>コイントスの結果は、「表が出る」か「裏が出るか」の2択です。</p>



<p>その時に<strong><span class="marker">”表か裏のどちらか一方”</span></strong>の結果だけに興味があれば片側検定。</p>



<p><strong><span class="marker">”表か裏のどっちでもいいから”</span></strong>極端な結果になるかどうかに興味があれば、両側検定です。</p>







<h3 class="wp-block-heading">片側検定と両側検定の違いをコイントスの例で考えてみる</h3>



<p>ちょっとイメージが難しい片側検定と両側検定。</p>



<p>ですが<a href="https://best-biostatistics.com/hypo_test/hypo.html" target="_blank" rel="noopener noreferrer">帰無仮説と対立仮説</a>を考えると、実は両者の違いは明確です。</p>







<p>まずは両側検定の場合の帰無仮説と対立仮説を確認してみます。</p>


<div class="swell-block-capbox cap_box is-style-small_ttl" data-colset="col1">
				<div class="cap_box_ttl"><span>両側検定の場合の帰無仮説と対立仮説</span></div>
				<div class="cap_box_content"> 帰無仮説H0：<strong>表が出る確率＝裏が出る確率</strong></p>
<p>対立仮説H1：<strong>表が出る確率<span style="color: #ff0000;">≠</span>裏が出る確率</strong></div>
			</div>







<p>次に、片側検定の場合の帰無仮説と対立仮説です。</p>


<div class="swell-block-capbox cap_box is-style-small_ttl" data-colset="col1">
				<div class="cap_box_ttl"><span>片側検定の場合の帰無仮説と対立仮説</span></div>
				<div class="cap_box_content"> 帰無仮説H0：<strong>表が出る確率＝裏が出る確率</strong></p>
<p>対立仮説H1：<strong>表が出る確率<span style="color: #ff0000;">＞</span>裏が出る確率</strong></div>
			</div>







<p>つまり、両側検定と片側検定では、<strong>帰無仮説は一緒ですが、証明したい対立仮説が異なる</strong>ということです。</p>







<h3 class="wp-block-heading">片側検定と両側検定の違いをT検定で考えてみる</h3>



<p>では次に、片側検定と両側検定の違いを<a href="https://best-biostatistics.com/stat-test/t-test.html">T検定</a>で考えてみます。</p>



<p>T検定の<a href="https://best-biostatistics.com/hypo_test/hypo.html" target="_blank" rel="noopener noreferrer">帰無仮説と対立仮説</a>は何かを見てみましょう。（A群とB群の2標本のT検定の場合）</p>







<p>まずは両側検定の場合の帰無仮説と対立仮説を確認してみます。</p>


<div class="swell-block-capbox cap_box is-style-small_ttl" data-colset="col1">
				<div class="cap_box_ttl"><span>両側検定の場合の帰無仮説と対立仮説</span></div>
				<div class="cap_box_content"> 帰無仮説H0：<strong>A群の母平均＝B群の母平均</strong></p>
<p>対立仮説H1：<strong>A群の母平均</strong><strong><span style="color: #ff0000;">≠</span>B群の母平均</strong></div>
			</div>



<div class="pointBox">

</div>



<p>次に、片側検定（A群の平均値の方が大きいと考える）の場合の帰無仮説と対立仮説です。</p>


<div class="swell-block-capbox cap_box is-style-small_ttl" data-colset="col1">
				<div class="cap_box_ttl"><span>片側検定の場合の帰無仮説と対立仮説</span></div>
				<div class="cap_box_content"> 帰無仮説H0：</p>
<p><strong>A群の母平均＝B群の母平均</strong></p>
<p>対立仮説H1：<strong>A群の母平均</strong><strong><span style="color: #ff0000;">＞</span>B群の母平均</strong><span style="font-size: 1em; letter-spacing: 0.05em;"></div>
			</div>











<p>先ほどのコイン投げの例と全く同じですね。</p>



<p>両側検定と片側検定では、<strong>帰無仮説は一緒ですが、証明したい対立仮説が異なる</strong>ということです。</p>



<p>ちなみに、B群の平均値の方が大きいと考える場合は、不等号の向きを変えて「<strong>A群の母平均</strong><strong><span style="color: #ff0000;">＜</span>B群の母平均</strong>」とすればOKです。</p>







<h2 class="wp-block-heading">臨床試験では片側検定と両側検定のどっちを使う？どっちに興味がある？</h2>


<div class="wp-block-image">
<figure class="aligncenter"><img decoding="async" width="640" height="323" src="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/7f418be16ff229275d0670150ea529e0_s-e1577088780405.jpg" alt="臨床試験では片側検定と両側検定のどっちを使う？どっちに興味がある？" class="wp-image-2528" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/7f418be16ff229275d0670150ea529e0_s-e1577088780405.jpg 640w, https://best-biostatistics.com/wp/wp-content/uploads/2019/10/7f418be16ff229275d0670150ea529e0_s-e1577088780405-300x151.jpg 300w" sizes="(max-width: 640px) 100vw, 640px" /></figure>
</div>






<p>臨床試験で新薬とプラセボを比較する状況での片側検定と両側検定を考えます。</p>



<p>すると、帰無仮説は<strong><span class="marker">“新薬の効果はプラセボの効果と同じ”</span></strong>です。</p>



<p>この帰無仮説は、片側検定でも両側検定でも同じですね。</p>







<p>片側検定の場合の対立仮説は、<strong><span class="marker">“新薬の効果はプラセボの効果よりも大きい“</span></strong>です。</p>



<p>つまり、数式では<strong><span class="marker">“新薬の効果＞プラセボの効果”</span></strong>となります。</p>







<p>両側検定の場合の対立仮説は、<strong><span class="marker">“新薬の効果はプラセボの効果とは異なる”</span></strong>です。</p>



<p>つまり、数式では<strong><span class="marker">“新薬の効果≠プラセボの効果”</span></strong>となります。</p>







<p>臨床試験では、一方にしか興味がないことが多いですね。</p>



<p>一方にしか興味がないというのはつまり、<span style="color: #ff0000;"><strong>「新薬の効果　＞　プラセボの効果」</strong></span>ということにしか興味がない場合です。</p>



<p><strong><span class="marker">「新薬の効果　＜　プラセボの効果」には興味がないですよね。</span></strong></p>



<p>そのため、臨床試験では全て片側検定でも良いのですが、なぜか慣例的に両側検定を使用しています。</p>



<p>ここには特に理由はありません。</p>



<p>私が担当した試験では片側検定で実施した試験もありますので、両側検定でなければダメだ、ということはありません。</p>







<h2 class="wp-block-heading">片側検定と両側検定で有意水準や棄却域はどうなるの？</h2>


<div class="wp-block-image">
<figure class="aligncenter"><img decoding="async" width="640" height="340" src="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/2ae4ec48eb55ae189560e8bb40caa89f_s-e1577089193118.jpg" alt="片側検定と両側検定で有意水準や棄却域はどうなるの？" class="wp-image-2529" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/2ae4ec48eb55ae189560e8bb40caa89f_s-e1577089193118.jpg 640w, https://best-biostatistics.com/wp/wp-content/uploads/2019/10/2ae4ec48eb55ae189560e8bb40caa89f_s-e1577089193118-300x159.jpg 300w" sizes="(max-width: 640px) 100vw, 640px" /></figure>
</div>






<p>片側検定と両側検定の違いは理解できましたか？</p>



<p>では次に、片側検定と両側検定の違いが、<a href="https://best-biostatistics.com/hypo_test/significant.html" target="_blank" rel="noopener noreferrer">有意水準や棄却域に対してどう関わってくるのかを確認します</a>。</p>







<p><a href="https://best-biostatistics.com/hypo_test/error.html" target="_blank" rel="noopener noreferrer">αエラー（第1種の過誤）は5%と明確に定められています</a>。</p>



<p>では、その5％を片側検定で使えたら、かなり有利になると思いませんか？</p>



<p>新薬とプラセボの差は、片側にしか興味がない（新薬＞プラセボ）ので、全て片側検定にして、有意水準を5％にする。</p>







<p>しかしながら、ICH E9（「臨床試験のための統計的原則」について）では、有意水準を明確に決めています。</p>



<p>つまり、<span style="color: #ff0000; font-size: 20px;"><strong>片側検定をする場合には有意水準を2.5%とし、両側検定の場合には5%とすること</strong></span>、が明記されています。</p>



<p>よって<strong>片側検定をする場合であっても5%のエラーを許容されていない</strong>ということです。</p>



<p>そのため、<strong>慣例的に臨床試験では両側検定で、有意水準を5%に設定する、ということが行われています</strong>。</p>







<h2 class="wp-block-heading">Rで片側検定と両側検定を実践する！</h2>



<p>実際に、サンプルデータを用いて片側検定と両側検定を実施します。</p>



<p>Rをダウンロードした際に含まれている「iris」というデータを使い、対応のないt検定とWilcoxonの順位和検定の2つを用いて実施します。</p>



<p>Rではt.test()関数やwilcox.test()関数の中で、alternative=””を指定することにより、片側検定か両側検定かを指定することができます。</p>



<p>alternative=””を指定しなければ、両側検定を実施します。alternative=””では下記の3つを指定することができます。</p>



<ul class="wp-block-list is-style-num_circle">
<li>two.sided：両側検定</li>



<li>less：1つ目に指定した変数が2つ目に指定した変数より小さいという片側検定</li>



<li>greater：1つ目に指定した変数が2つ目に指定した変数より大きいという片側検定</li>
</ul>



<pre class="wp-block-code has-white-color has-black-background-color has-text-color has-background has-link-color wp-elements-b6338c4fd2c80a4146c45d95a0467ff3"><code># データの読み込み
data("iris")

# データの確認
head(iris)

# SetosaとVersicolorのデータ抽出
setosa &lt;- subset(iris, Species == "setosa")
versicolor &lt;- subset(iris, Species == "versicolor")

# 対応のないt検定での両側検定と片側検定
t_test_two &lt;- t.test(setosa$Sepal.Length, versicolor$Sepal.Length, alternative = "two.sided")
t_test_less &lt;- t.test(setosa$Sepal.Length, versicolor$Sepal.Length, alternative = "less")
t_test_greater &lt;- t.test(setosa$Sepal.Length, versicolor$Sepal.Length, alternative = "greater")

print(t_test_two) 
print(t_test_less)
print(t_test_greater)</code></pre>



<p>上記のプログラムを実行すると、下記のように結果得られます。（見やすさの観点から、p値のみ記載します。）</p>



<figure class="wp-block-table"><table class="has-fixed-layout"><tbody><tr><td>alternative=&#8221;&#8221;の指定</td><td>p値</td></tr><tr><td>two.sided</td><td>2.2e-16</td></tr><tr><td>less</td><td>2.2e-16</td></tr><tr><td>greater</td><td>1</td></tr></tbody></table></figure>



<p>e-16は、10のマイナス16乗の意味です。そのため「めちゃめちゃ小さいp値である」ということがわかります。</p>



<p>次に、ウィルコクソンの順位和検定で両側検定と片側検定を実施します。</p>



<pre class="wp-block-code has-white-color has-black-background-color has-text-color has-background has-link-color wp-elements-3239da6ae1caabf9f7b21d14397621c9"><code># ウィルコクソンの順位和検定での両側検定と片側検定
wilcox_test_two &lt;- wilcox.test(setosa$Sepal.Length, versicolor$Sepal.Length, alternative = "two.sided")
wilcox_test_less &lt;- wilcox.test(setosa$Sepal.Length, versicolor$Sepal.Length, alternative = "less")
wilcox_test_greater &lt;- wilcox.test(setosa$Sepal.Length, versicolor$Sepal.Length, alternative = "greater")

print(wilcox_test_two) 
print(wilcox_test_less)
print(wilcox_test_greater)</code></pre>



<figure class="wp-block-table"><table class="has-fixed-layout"><tbody><tr><td>alternative=&#8221;&#8221;の指定</td><td>p値</td></tr><tr><td>two.sided</td><td>8.346e-14</td></tr><tr><td>less</td><td>4.173e-14</td></tr><tr><td>greater</td><td>1</td></tr></tbody></table></figure>



<h2 class="wp-block-heading">片側検定と両側検定の違いや使い分けまとめ</h2>


<div class="wp-block-image">
<figure class="aligncenter"><img decoding="async" width="640" height="334" src="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/ec17114ba3d7d829dcd97f397b8c1421_s-e1577088691586.jpg" alt="片側検定と両側検定の違いや使い分けまとめ" class="wp-image-2527" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/ec17114ba3d7d829dcd97f397b8c1421_s-e1577088691586.jpg 640w, https://best-biostatistics.com/wp/wp-content/uploads/2019/10/ec17114ba3d7d829dcd97f397b8c1421_s-e1577088691586-300x157.jpg 300w" sizes="(max-width: 640px) 100vw, 640px" /></figure>
</div>






<p>片側検定と両側検定の違いは「どちらに興味があるのか」という違いでした。</p>



<p>臨床試験では「新薬の効果＞プラセボの効果」にしか興味がないため、片側検定でも成り立ちます。</p>



<p>ですが、慣例的には両側検定で5％の有意水準を設定して試験を実施する事が多いです。</p>
]]></content:encoded>
					
					<wfw:commentRss>https://best-biostatistics.com/hypo_test/one-way.html/feed</wfw:commentRss>
			<slash:comments>2</slash:comments>
		
		
			</item>
		<item>
		<title>P値とはどんな意味？p-valueの手計算方法や求め方を例でわかりやすく</title>
		<link>https://best-biostatistics.com/hypo_test/p-value.html</link>
					<comments>https://best-biostatistics.com/hypo_test/p-value.html#comments</comments>
		
		<dc:creator><![CDATA[beat1115]]></dc:creator>
		<pubDate>Mon, 07 Aug 2023 10:10:05 +0000</pubDate>
				<category><![CDATA[統計学的検定の基礎]]></category>
		<category><![CDATA[0.05]]></category>
		<category><![CDATA[P値]]></category>
		<category><![CDATA[有意水準]]></category>
		<category><![CDATA[統計学的検定]]></category>
		<guid isPermaLink="false">http://best-biostatistics.com/wp/2016/02/07/p-value/</guid>

					<description><![CDATA[<p><img src="https://best-biostatistics.com/wp/wp-content/uploads/2016/02/スクリーンショット-2018-10-21-06.56.45.png" class="webfeedsFeaturedVisual" /></p>検定とは何でしょうか？P値と有意水準の違いは？結果が良ければそれは真実？
検定の便利な点と、安易に検定をする怖さを解説します。
]]></description>
										<content:encoded><![CDATA[<p><img src="https://best-biostatistics.com/wp/wp-content/uploads/2016/02/スクリーンショット-2018-10-21-06.56.45.png" class="webfeedsFeaturedVisual" /></p><p>あなたは、P値って何なのか、考えたことはあるでしょうか？</p>
<p>以前、参加したことのある統計セミナーで「P値を説明してください」という問題が出たことがあります。</p>
<p>あなたはどう回答しますか？</p>
<p>そのセミナーの中で、面白かった回答がありました。</p>
<p>「0.05を切ったら嬉しいもの」</p>
<p>まぁ確かにな、と思いました。</p>
<p>&nbsp;</p>
<p>P値ほど、誤解されて使われているものはありません。</p>
<p>とりあえず0.05を下回ったら、何も考えずにOK。</p>
<p>そんな使い方をされていることが多い。</p>
<p>でも、実はそれ以上にP値は深い意味を持っています。</p>
<p>このページでぜひともP値は何かを学んでいきましょう！</p>
<p>手計算での求め方を、コイン投げを例にして解説しますね！</p>
<p>&nbsp;</p>
<h2>P値とはどんな意味かをわかりやすく教えて！</h2>
<p><img decoding="async" class="aligncenter wp-image-2530 size-full" src="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/987eca87017b5f2fa265f89558d4724a_s-e1577496841202.jpg" alt="P値とはどんな意味かをわかりやすく教えて！" width="640" height="345" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/987eca87017b5f2fa265f89558d4724a_s-e1577496841202.jpg 640w, https://best-biostatistics.com/wp/wp-content/uploads/2019/10/987eca87017b5f2fa265f89558d4724a_s-e1577496841202-300x162.jpg 300w" sizes="(max-width: 640px) 100vw, 640px" /></p>
<p>まずは、P値って何かを考えたことはありますか？</p>
<p>P値。ピーチ。</p>
<p>・・・桃？？</p>
<p>&nbsp;</p>
<p>冗談はさておき、P値は「何かの確率」を示しています。</p>
<p>ちなみにP値の「P」は「Probability」の略です。「確率」ですね。</p>
<p>重要なのは、「何の」確率か、ということです。</p>
<p>&nbsp;</p>
<h3>P値（p-value）の意味は帰無仮説下で、その結果以上（以下）が出る確率である</h3>
<p>正解を先に言います。</p>
<p>P値は以下の言葉で言い換えることができます。</p>
<p><div class="swell-block-capbox cap_box is-style-small_ttl" data-colset="col1">
				<div class="cap_box_ttl"><span>P値とは？</span></div>
				<div class="cap_box_content"> <strong><a href="https://best-biostatistics.com/hypo_test/hypo.html">帰無仮説</a>を考えている時に、得られた結果より極端な結果が出る確率</strong></div>
			</div></p>
<p>&nbsp;</p>
<p>わかりますか？</p>
<p>おそらく文字だけで説明されても全然わからないと思いますので、コインを例に考えてみましょう。</p>
<p>&nbsp;</p>
<h2>P値の求め方を手計算で求めながら、意味をコイン投げの事例で学ぶ</h2>
<p><img decoding="async" class="aligncenter wp-image-2529 size-full" src="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/2ae4ec48eb55ae189560e8bb40caa89f_s-e1577089193118.jpg" alt="P値の求め方を手計算で求めながら、意味をコイン投げの事例で学ぶ" width="640" height="340" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/2ae4ec48eb55ae189560e8bb40caa89f_s-e1577089193118.jpg 640w, https://best-biostatistics.com/wp/wp-content/uploads/2019/10/2ae4ec48eb55ae189560e8bb40caa89f_s-e1577089193118-300x159.jpg 300w" sizes="(max-width: 640px) 100vw, 640px" /></p>
<p>コイントスで、<strong>表が出たら1万円をもらえる、裏が出たら1万円を支払う</strong>、という場面を想定します。</p>
<p>そしてあなたは、そのコインがイカサマであれば参加しない。</p>
<p>つまり<span class="marker">裏が出やすいコインである、ということであれば参加したくない</span>と思っています。</p>
<p>&nbsp;</p>
<p>では、その「イカサマなコインである」を統計学的に証明していきましょう。</p>
<p>まずは、<a href="https://best-biostatistics.com/hypo_test/hypo.html" target="_blank" rel="noopener noreferrer">帰無仮説と対立仮説</a>を考えます。</p>
<p>&nbsp;</p>
<p>今回のコイン投げの場合、帰無仮説と対立仮説はどのようになるでしょうか？</p>
<p>このようになりますね。</p>
<p>&nbsp;</p>
<p><div class="swell-block-capbox cap_box is-style-small_ttl" data-colset="col1">
				<div class="cap_box_ttl"><span>コイン投げの場合の帰無仮説と対立仮説</span></div>
				<div class="cap_box_content"> </p>
<p><strong>帰無仮説は「コインはイカサマでない」</strong></p>
<p><strong>対立仮説は「コインはイカサマである」</strong></p>
<p></div>
			</div></p>
<div class="boldBox">
<p>&nbsp;</p>
</div>
<p>ではここで一つ問題です。</p>
<div class="questionBox">
<p><strong><span class="marker">帰無仮説「コインはイカサマでない」という前提に立った場合に、裏（若しくは表）が出る確率はどうなるでしょうか？</span></strong></p>
</div>
<p>帰無仮説を考えている場合とは言い換えると、「コインはイカサマではない」という場合を想定しています。</p>
<p>つまり、あなたが普段持っている100円玉を投げた時に、どんな確率で裏（もしくは表）が出るかということです。</p>
<p>&nbsp;</p>
<p>当然わかりますよね。</p>
<div class="exclamationBox">
<p><strong><span class="marker">帰無仮説「コインはイカサマでない」という前提に立った場合に、裏（若しくは表）が出る確率は1/2である</span></strong></p>
</div>
<p>&nbsp;</p>
<h3>P値を手計算するために10人のコイン投げの結果を観察してみる</h3>
<p>そして、このコインがイカサマかどうかを確かめるために、自分より前の10人の結果を調べることにしました。</p>
<p>10人の結果を見てみましょう。</p>
<p><strong>帰無仮説では表が出る確率は1/2であるため、10回中５回は表が出るはず</strong>です。</p>
<p>ですが、たまたま表が７回でたり、反対に２回しか出ない時もあります。</p>
<p>&nbsp;</p>
<p>つまり、10人のコイン投げで表が出る回数は、0〜10回があり得ます。</p>
<p>あなたの想像の通り、<strong><span class="marker">10回コインを投げたうち、10回表が出ることは稀で、0回表が出ることも稀です</span></strong>。</p>
<p>そんなあなたの考えを確率で表現したのが以下の表です。<br />
<!-- ★テーブルタグここから★ --></p>
<p>&nbsp;</p>
<table style="border-collapse: collapse; width: 100%;" border="1">
<tbody>
<tr>
<td style="width: 10%; text-align: center;">表が出る回数</td>
<td style="width: 10%; text-align: center;">0</td>
<td style="width: 10%; text-align: center;">1</td>
<td style="width: 10%; text-align: center;">2</td>
<td style="width: 10%; text-align: center;">3</td>
<td style="width: 10%; text-align: center;">4</td>
<td style="width: 10%; text-align: center;">5</td>
<td style="width: 10%; text-align: center;">6</td>
<td style="width: 10%; text-align: center;">7</td>
<td style="width: 5%; text-align: center;">8</td>
<td style="width: 2.5%; text-align: center;">9</td>
<td style="width: 2.5%; text-align: center;">10</td>
</tr>
<tr>
<td style="width: 10%; text-align: center;">確率</td>
<td style="width: 10%; text-align: center;">0.001</td>
<td style="width: 10%; text-align: center;">0.010</td>
<td style="width: 10%; text-align: center;">0.044</td>
<td style="width: 10%; text-align: center;">0.117</td>
<td style="width: 10%; text-align: center;">0.205</td>
<td style="width: 10%; text-align: center;">0.246</td>
<td style="width: 10%; text-align: center;">0.205</td>
<td style="width: 10%; text-align: center;">0.117</td>
<td style="width: 5%; text-align: center;">0.044</td>
<td style="width: 2.5%; text-align: center;">0.010</td>
<td style="width: 2.5%; text-align: center;">0.001</td>
</tr>
<tr>
<td style="width: 10%; text-align: center;">累積確率</td>
<td style="width: 10%; text-align: center;">0.001</td>
<td style="width: 10%; text-align: center;">0.011</td>
<td style="width: 10%; text-align: center;">0.055</td>
<td style="width: 10%; text-align: center;">00.172</td>
<td style="width: 10%; text-align: center;">0.377</td>
<td style="width: 10%; text-align: center;">0.623</td>
<td style="width: 10%; text-align: center;">0.828</td>
<td style="width: 10%; text-align: center;">0.945</td>
<td style="width: 5%; text-align: center;">0.989</td>
<td style="width: 2.5%; text-align: center;">0.999</td>
<td style="width: 2.5%; text-align: center;">1.000</td>
</tr>
</tbody>
</table>
<p>&nbsp;</p>
<p><!-- ★テーブル用スタイルここまで★ -->これは、二項確率というものを計算しています。<!-- ★テーブルタグここまで★ --></p>
<p>例えば「表が出る回数3」の確率というのは、10回コイン投げをした場合に、3回表が出る確率を二項確率の計算式を元に計算しています。</p>
<p>&nbsp;</p>
<p>表を見ると、あなたが想像している通り、<span class="marker">10回中５回表が出る確率が24.6%と一番高い</span>です。</p>
<p>一方で、<span class="marker">０回や10回表が出る確率は0.1%と、一番小さい確率</span>です。</p>
<p>&nbsp;</p>
<p>一番下の行は、<strong>累積確率と呼ばれ、左から順に確率を足し合わせたもの</strong>になります。</p>
<p>例えば「表が出る回数が2回」のところにある累積確率（0.055）は、0回の確率と1回の確率と2回の確率を全て足し合わせた結果になっています。</p>
<p>つまり、<span class="marker">0.001+0.010+0.044=0.055</span>です。</p>
<p>&nbsp;</p>
<h3>P値とは累積確率</h3>
<p>そして、この<strong>「累積確率」がP値</strong>になります。</p>
<p>・・・たぶん、ぽかーんとしている方が大半かもしれません。。</p>
<p>ですが、そうなのです。</p>
<p>一般化してP値を言葉で置き換えます。</p>
<p>&nbsp;</p>
<div class="simple-box1">
<p><strong>P値とは、帰無仮説下（表が出る確率は1/2である）での、その結果より極端な結果が出る確率</strong></p>
</div>
<p>&nbsp;</p>
<p>このP値が0.05より小さければ、想定している仮説（帰無仮説）の下では、その結果が出る確率は0.05以下でしかない。</p>
<p>このコイン投げの例でいうと、<strong>「1/2は表が出ると想定しているのに、その結果が出る確率は0.05以下しかない」</strong></p>
<p>そのような結果が出た場合に、<strong><span class="marker">想定している仮説が間違っている（＝帰無仮説が間違っている）んじゃないか</span></strong>。</p>
<p>と考えます。</p>
<p>つまり、帰無仮説を棄却し、対立仮説を採択するのです。</p>
<p>&nbsp;</p>
<p>このコインの例では、表が1回以下である確率が0.011であり、2回以下である確率が0.055です。</p>
<p>そのため、イカサマであると判断する数値的な閾値を0.05とした場合には、10回分の結果から、<strong>表が1回以下であればこのコインはイカサマであると結論付け、ゲームには参加しないという判断を下す</strong>という流れです。</p>
<p>&nbsp;</p>
<h2>数値としてのp値は「要約統計量の一つ」である</h2>
<p>統計学としての理論的なp値は、上記で解説した「確率」として定義されるものです。</p>
<p>しかしそれはあくまで、数学的概念としてのp値。</p>
<p>一方で、<span class="marker"><strong>出力された「数字としてのp値」は、<a href="https://best-biostatistics.com/stat-test/toukeiryou.html">検定統計量</a>を変換して計算された、要約指標の一種</strong></span>です。</p>
<p>確率変数と言っても良い指標であり、確率変数であれば何らかの確率分布に従う。（引用：<a href="https://www.amazon.co.jp/%E5%8C%BB%E5%AD%A6%E3%81%AE%E3%81%9F%E3%82%81%E3%81%AE%E5%9B%A0%E6%9E%9C%E6%8E%A8%E8%AB%96I-%E2%80%95%E4%B8%80%E8%88%AC%E5%8C%96%E7%B7%9A%E5%9E%8B%E3%83%A2%E3%83%87%E3%83%AB%E2%80%95-%E7%94%B0%E4%B8%AD-%E5%8F%B8%E6%9C%97/dp/4254122705/ref=sr_1_1?__mk_ja_JP=%E3%82%AB%E3%82%BF%E3%82%AB%E3%83%8A&amp;keywords=%E5%8C%BB%E5%AD%A6%E3%81%AE%E3%81%9F%E3%82%81%E3%81%AE%E5%9B%A0%E6%9E%9C%E6%8E%A8%E8%AB%96&amp;qid=1691454875&amp;sr=8-1">医学のための因果推論I</a>, p51）</p>
<p>特に気をつけていただきたいのは、<a href="https://best-biostatistics.com/hypo_test/num-subject.html">サンプルサイズ</a>が小さい時には、p値の確率的変動は不安定で、到底信頼できるものではないということ。</p>
<p>仮説検定の目標は、<a href="https://best-biostatistics.com/hypo_test/error.html">αエラーとβエラーを制御すること</a>であって、適切なサンプルサイズ設計がなされていることが前提。</p>
<p><span class="marker"><strong>医学研究では、p値はデータの要約指標という観点で扱うのがよく、その意味では推定値や信頼区間など大差ないのだから、特別扱いすべきではありません</strong></span>。</p>
<p>むしろ、信頼区間の方が情報量が多く、データを理解するために役立つ指標です。</p>
<p>&nbsp;</p>
<h2>P値に関するまとめ</h2>
<p><img decoding="async" class="aligncenter wp-image-2527 size-full" src="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/ec17114ba3d7d829dcd97f397b8c1421_s-e1577088691586.jpg" alt="P値に関するまとめ" width="640" height="334" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/ec17114ba3d7d829dcd97f397b8c1421_s-e1577088691586.jpg 640w, https://best-biostatistics.com/wp/wp-content/uploads/2019/10/ec17114ba3d7d829dcd97f397b8c1421_s-e1577088691586-300x157.jpg 300w" sizes="(max-width: 640px) 100vw, 640px" /></p>
<p>P値は帰無仮説下で、その結果以上（以下）が出る確率である。</p>
<p>つまり、帰無仮説下での確率が<a href="https://best-biostatistics.com/hypo_test/significant.html">有意水準の0.05</a>を下回った場合、帰無仮説を考えていることが間違っているのではないかと判断して棄却し、対立仮説を採択する。</p>
<p>&nbsp;</p>
<p>P値に関して動画で解説しています。</p>
<p>ぜひブログ記事を併せて確認してみてください。</p>
<p style="text-align: center;"><iframe src="https://www.youtube.com/embed/E3xI5TMMwOc" width="560" height="315" frameborder="0" allowfullscreen="allowfullscreen" data-mce-fragment="1"></iframe></p>
]]></content:encoded>
					
					<wfw:commentRss>https://best-biostatistics.com/hypo_test/p-value.html/feed</wfw:commentRss>
			<slash:comments>1</slash:comments>
		
		
			</item>
	</channel>
</rss>
