<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>データを解析しよう &#8211; いちばんやさしい、医療統計</title>
	<atom:link href="https://best-biostatistics.com/category/summary/feed" rel="self" type="application/rss+xml" />
	<link>https://best-biostatistics.com</link>
	<description>数式にとらわれない、イメージとしての統計！</description>
	<lastBuildDate>Tue, 21 Apr 2026 23:41:09 +0000</lastBuildDate>
	<language>ja</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	<generator>https://wordpress.org/?v=6.9.4</generator>

<image>
	<url>https://best-biostatistics.com/wp/wp-content/uploads/2024/04/cropped-Data-Seed-Inc.-logo-I-32x32.png</url>
	<title>データを解析しよう &#8211; いちばんやさしい、医療統計</title>
	<link>https://best-biostatistics.com</link>
	<width>32</width>
	<height>32</height>
</image> 
<atom:link rel="hub" href="https://pubsubhubbub.appspot.com"/>
<atom:link rel="hub" href="https://pubsubhubbub.superfeedr.com"/>
<atom:link rel="hub" href="https://websubhub.com/hub"/>
<atom:link rel="self" href="https://best-biostatistics.com/category/summary/feed"/>
	<item>
		<title>多重代入法（多重補完法）をわかりやすく解説！EZRでは実施できる？</title>
		<link>https://best-biostatistics.com/summary/multiple_imputation.html</link>
					<comments>https://best-biostatistics.com/summary/multiple_imputation.html#respond</comments>
		
		<dc:creator><![CDATA[beat1115]]></dc:creator>
		<pubDate>Tue, 21 Apr 2026 23:00:59 +0000</pubDate>
				<category><![CDATA[データを解析しよう]]></category>
		<guid isPermaLink="false">https://best-biostatistics.com/?p=6033</guid>

					<description><![CDATA[<p><img src="https://best-biostatistics.com/wp/wp-content/uploads/2022/07/統計のYoutubeアイキャッチ-21-1024x576.jpg" class="webfeedsFeaturedVisual" /></p>この記事では「多重代入法（多重補完法）をわかりやすく解説！EZRでは実施できる？」ということでお伝えします。 多重代入法（Multiple Imputation）は、医療系の論文でよく使われる方法。 ですが「どういった目 [&#8230;]]]></description>
										<content:encoded><![CDATA[<p><img src="https://best-biostatistics.com/wp/wp-content/uploads/2022/07/統計のYoutubeアイキャッチ-21-1024x576.jpg" class="webfeedsFeaturedVisual" /></p>
<p>この記事では「多重代入法（多重補完法）をわかりやすく解説！EZRでは実施できる？」ということでお伝えします。</p>



<p>多重代入法（Multiple Imputation）は、医療系の論文でよく使われる方法。</p>



<p>ですが「どういった目的で使われて、実際にどうすればいいの？」と思われるかもしれません。</p>



<p>そのため</p>



<ol class="wp-block-list">
<li><strong>多重代入法とは欠測値（欠損値）に対応する方法である</strong></li>



<li><strong>多重代入法の概念をわかりやすく解説</strong></li>



<li><strong>EZRで多重代入法はできる？</strong></li>
</ol>



<p>ということをわかりやすく解説します！</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">多重代入法とは欠測値（欠損値）に対応する方法</h2>



<figure class="wp-block-image"><img decoding="async" width="2560" height="1363" src="https://best-biostatistics.com/wp/wp-content/uploads/2022/06/AdobeStock_410984850-scaled-e1656399955910.jpeg" alt="" class="wp-image-5960" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2022/06/AdobeStock_410984850-scaled-e1656399955910.jpeg 2560w, https://best-biostatistics.com/wp/wp-content/uploads/2022/06/AdobeStock_410984850-scaled-e1656399955910-300x160.jpeg 300w, https://best-biostatistics.com/wp/wp-content/uploads/2022/06/AdobeStock_410984850-scaled-e1656399955910-1024x545.jpeg 1024w, https://best-biostatistics.com/wp/wp-content/uploads/2022/06/AdobeStock_410984850-scaled-e1656399955910-768x409.jpeg 768w, https://best-biostatistics.com/wp/wp-content/uploads/2022/06/AdobeStock_410984850-scaled-e1656399955910-1536x818.jpeg 1536w, https://best-biostatistics.com/wp/wp-content/uploads/2022/06/AdobeStock_410984850-scaled-e1656399955910-2048x1090.jpeg 2048w" sizes="(max-width: 2560px) 100vw, 2560px" /></figure>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>そもそも<span class="marker"><strong>欠測値とは、本来得られるはずだったデータが得られていないこと</strong></span>です。</p>



<p>例えば、下記のようなデータの黄色いセル。</p>


<div class="wp-block-image">
<figure class="aligncenter"><img decoding="async" width="300" height="341" src="https://best-biostatistics.com/wp/wp-content/uploads/2021/12/ScreenShot-2021-12-16-9.13.24-e1639690484504.png" alt="" class="wp-image-5457"/></figure>
</div>


<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>全被験者からWeek4までデータを取りたかったのですが、被験者2ではWeek3とWeek4のデータが取られていません。</p>



<p>同様に、被験者3ではWeek3のデータが取られていません。</p>



<p>こういったデータのことを<a href="https://best-biostatistics.com/summary/missing_value.html" data-type="post" data-id="5456">欠測値（欠損値）</a>と呼んでいます。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading">欠測値があると何が問題なのか？</h3>



<p>では、欠測値があると何が問題になるのでしょうか？</p>



<p>大きく分けると3つあります。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<ol class="wp-block-list has-swl-gray-background-color has-background">
<li><strong>本来得られるはずだった解析結果が得られにくくなる</strong></li>



<li><strong>データ数が少なくなる</strong></li>



<li><strong>試験の信頼性の問題になる</strong></li>
</ol>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>欠測値は「本来得られるはずだったデータが得られていない」ことですから、欠測のあるデータ全体で解析をしても、本来得たかった解析結果は得られにくいですよね。</p>



<p>そもそも欠測値をそのまま放置して解析をするとデータ数が少なくなるため、<a href="https://best-biostatistics.com/hypo_test/num-subject.html">サンプルサイズの小ささ</a>につながります。</p>



<p>また、多少の欠測はどの研究でもあり得るとは認識されていますが、欠測が多すぎるとその試験自体「大丈夫か！？」となってしまいます。</p>



<p>そのため、どれだけ欠測値への対処が適切でも、欠測値が多すぎれば意味がないことに。</p>



<p>なので大前提としては大前提として欠測を起こさないことが大事であることは念頭に置いておきましょう。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading">欠測値への対処方法は？</h3>



<p>では欠測値が発生したとして、対処法や埋め方（補完方法）はあるのでしょうか？</p>



<p>大きく分けると3つほどあります。</p>



<ol class="wp-block-list has-swl-gray-background-color has-background">
<li><strong>単一補完（Single Imputation）</strong></li>



<li><strong>多重補完（Multiple Imputation）</strong></li>



<li><strong>モデル解析（一般化線形混合モデル：Generalized Linear Mixed Model）</strong></li>
</ol>



<p>詳しくは「<a href="https://best-biostatistics.com/summary/missing_value.html">欠測値（欠損値）とは？埋め方（補完方法）や対処法はある？</a>」という記事を見ていただきたいですが、最近の傾向では多重補完かモデル解析（一般（化）線形混合効果モデル）がいいとされています。</p>



<p>実際に欠測値への対処をする際には、「欠測メカニズム」ということを考えなければいけないですが、そちらに関しても「<a href="https://best-biostatistics.com/summary/missing_value.html">欠測値（欠損値）とは？埋め方（補完方法）や対処法はある？</a>」という記事を見ていただければと思います。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>しかし、どんな方法でも「これがベスト」という方法はないことは前提であると理解しておきましょう。</p>



<p>なぜなら欠測じゃなかった時にどんな値だったか誰も知らないから。</p>



<p>欠測への対処方法には、強い仮定が入ります。</p>



<p>そのため、<a href="https://best-biostatistics.com/review/sensitivity-analysis.html">仮定をずらしても同じ解析結果が得られるのか、という感度解析を実施することがとても重要</a>。</p>



<p>感度解析として実施した複数の解析で結論が同じになれば、例え欠測があったとしても<a href="https://best-biostatistics.com/review/robust.html">頑健性のあるデータだった</a>ということを主張できます。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">多重代入法の概念をわかりやすく解説</h2>



<figure class="wp-block-image"><img decoding="async" width="2560" height="1292" src="https://best-biostatistics.com/wp/wp-content/uploads/2022/05/AdobeStock_119574167-scaled-e1652757543169.jpeg" alt="" class="wp-image-5821" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2022/05/AdobeStock_119574167-scaled-e1652757543169.jpeg 2560w, https://best-biostatistics.com/wp/wp-content/uploads/2022/05/AdobeStock_119574167-scaled-e1652757543169-300x151.jpeg 300w, https://best-biostatistics.com/wp/wp-content/uploads/2022/05/AdobeStock_119574167-scaled-e1652757543169-1024x517.jpeg 1024w, https://best-biostatistics.com/wp/wp-content/uploads/2022/05/AdobeStock_119574167-scaled-e1652757543169-768x388.jpeg 768w, https://best-biostatistics.com/wp/wp-content/uploads/2022/05/AdobeStock_119574167-scaled-e1652757543169-1536x775.jpeg 1536w, https://best-biostatistics.com/wp/wp-content/uploads/2022/05/AdobeStock_119574167-scaled-e1652757543169-2048x1034.jpeg 2048w" sizes="(max-width: 2560px) 100vw, 2560px" /></figure>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>欠測値が何かを理解できたところで、多重代入法（Multiple Imputation）について解説していきます。</p>



<p>多重代入法の手順は、下記の4つ。</p>



<ol class="wp-block-list">
<li><strong>観測されているデータを基にして欠測データの事後分布を構築し、この事後分布からの無作為抽出を行って欠測を埋める。</strong></li>



<li><strong>1の手順で無作為に欠測を埋めたデータセットをM個（＞1）用意する。</strong></li>



<li><strong>M個のデータセットそれぞれに対して解析を実施する（M個の結果が得られる）</strong></li>



<li><strong>M個の結果を適切な統合方法で1つに統合する（最終的に1つの結果が得られる）</strong></li>
</ol>



<p>この手順のイメージは、<a href="https://www.stat.go.jp/training/2kenkyu/ihou/71/pdf/2-2-713.pdf">高橋先生・伊藤先生のこちらの論文の図2.1がわかりやすい</a>です。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<figure class="wp-block-image"><img decoding="async" width="640" height="366" src="https://best-biostatistics.com/wp/wp-content/uploads/2022/07/ScreenShot-2022-07-22-14.54.35.png" alt="" class="wp-image-6034" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2022/07/ScreenShot-2022-07-22-14.54.35.png 640w, https://best-biostatistics.com/wp/wp-content/uploads/2022/07/ScreenShot-2022-07-22-14.54.35-300x172.png 300w" sizes="(max-width: 640px) 100vw, 640px" /></figure>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>重要なのは<span class="marker"><strong>「M個のデータセットそれぞれに対して解析を実施し、最後に統合する」</strong></span>という手順。</p>



<p>M個のデータセットの平均を計算して1つのデータセットにして1回の解析をする、という<span style="color: #ff0000;"><strong>間違った手順で理解している方がいるので注意</strong></span>が必要です。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading">多重代入法では何個のデータセット作成が必要？</h3>



<p>多重代入法としてM個のデータセットを作って解析し、最終的に統合することはわかりました。</p>



<p>じゃあMの具体的な数値はどれぐらいが適切なの？と疑問に思うかなと思います。</p>



<p>この疑問に対しても、<a href="https://www.stat.go.jp/training/2kenkyu/ihou/71/pdf/2-2-713.pdf">高橋先生・伊藤先生のこちらの論文がわかりやすい</a>です。</p>



<ul class="wp-block-list">
<li><strong>概ね 5～10 では少なすぎ、20～50 程度が適切だと考えられる。</strong></li>



<li><strong>欠測率に応じて「20%未満ならば M =20」「20%～30%ならば M = 30」「30%～40%ならば M = 40」「40%～50%ならば M = 50」といった具合に設定することが適切。</strong></li>



<li><strong>欠測率に関わらず、M = 100 を超えて得られるものは非常に少ない。</strong></li>



<li><strong>たとえ M 数を数百まで拡大したとしても、補定値の精度を保証できなくなるおそれがある。</strong></li>
</ul>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>実際の論文ではどう設定しているのかをみると、例えば以下の論文ではM=20に設定されていることがわかります。</p>



<figure class="wp-block-image"><img decoding="async" width="852" height="168" src="https://best-biostatistics.com/wp/wp-content/uploads/2022/07/ScreenShot_2022-07-22_15_05_50.jpg" alt="" class="wp-image-6035" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2022/07/ScreenShot_2022-07-22_15_05_50.jpg 852w, https://best-biostatistics.com/wp/wp-content/uploads/2022/07/ScreenShot_2022-07-22_15_05_50-300x59.jpg 300w, https://best-biostatistics.com/wp/wp-content/uploads/2022/07/ScreenShot_2022-07-22_15_05_50-768x151.jpg 768w" sizes="(max-width: 852px) 100vw, 852px" /></figure>



<p><span style="font-size: 10px;">（参考：Multicenter Trial of a Combination Probiotic for Children with Gastroenteritis (Stephen B. Freedman et al., November 22, 2018, N Engl J Med 2018;379:2015-26.)）</span></p>



<p>そのため、総合的に考えると、<span style="color: #ff0000;"><strong>常にM=50程度に設定しておけば問題なさそう</strong></span>かなと思います。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">EZRで多重代入法はできる？</h2>



<figure class="wp-block-image"><img decoding="async" width="2560" height="1087" src="https://best-biostatistics.com/wp/wp-content/uploads/2022/04/AdobeStock_407319626-scaled.jpeg" alt="" class="wp-image-5785" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2022/04/AdobeStock_407319626-scaled.jpeg 2560w, https://best-biostatistics.com/wp/wp-content/uploads/2022/04/AdobeStock_407319626-300x127.jpeg 300w, https://best-biostatistics.com/wp/wp-content/uploads/2022/04/AdobeStock_407319626-1024x435.jpeg 1024w, https://best-biostatistics.com/wp/wp-content/uploads/2022/04/AdobeStock_407319626-768x326.jpeg 768w, https://best-biostatistics.com/wp/wp-content/uploads/2022/04/AdobeStock_407319626-1536x652.jpeg 1536w, https://best-biostatistics.com/wp/wp-content/uploads/2022/04/AdobeStock_407319626-2048x869.jpeg 2048w" sizes="(max-width: 2560px) 100vw, 2560px" /></figure>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>多重代入法の原理はわかったので、実際に多重代入法をやりたい！</p>



<p><a href="https://best-biostatistics.com/category/ezr">無料の統計ソフトであるEZR</a>では実施できないだろうか？と思うかもしれません。</p>



<p>結露から言えば、EZRのメインメニューでは多重代入法を実施できないです。</p>



<p>しかし、バックグラウンドで動いているRでは問題なく多重代入法を使うことができます。</p>



<p>実際にはmiceというパッケージを使い、手順は以下の3つです。</p>



<ol class="wp-block-list">
<li><strong>miceを使ってM個の補完データを作成する</strong></li>



<li><strong>withでM個の解析を実施する</strong></li>



<li><strong>poolで最終的に統合する</strong></li>
</ol>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading">Rで多重代入法を実施するプログラム例</h3>



<p>では具体的なプログラム例を見ていきましょう。</p>



<p>M=50、Cox回帰を実施する、欠測のあるデータは「dat」という名前でインポートされている前提で例を紹介します。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<ol class="wp-block-list">
<li><strong>miceを使ってM個の補完データを作成する：<br>tempdat &lt;- mice (dat, m=50, method=&#8221;pmm&#8221;, pritFlag = FALSE, seed = 123)</strong></li>



<li><strong>withでM個の解析を実施する：<br>fit &lt;- with(data=tempdat, coxph(formula = Surv(PFS, PFS.status == 1) ~ Grade + Sex, method = &#8220;breslow&#8221;))</strong></li>



<li><strong>poolで最終的に統合する：<br>summary(pool(fit), exponentiate=TRUE, conf.int=0.95)</strong></li>
</ol>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>上記の3つのプログラムを参考にしていただければ、多重代入法を実施できます！</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">まとめ</h2>



<figure class="wp-block-image"><img decoding="async" width="2560" height="1164" src="https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_101008656-scaled-e1637541296894.jpeg" alt="" class="wp-image-5331" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_101008656-scaled-e1637541296894.jpeg 2560w, https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_101008656-scaled-e1637541296894-300x136.jpeg 300w, https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_101008656-scaled-e1637541296894-1024x466.jpeg 1024w, https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_101008656-scaled-e1637541296894-768x349.jpeg 768w, https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_101008656-scaled-e1637541296894-1536x698.jpeg 1536w, https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_101008656-scaled-e1637541296894-2048x931.jpeg 2048w" sizes="(max-width: 2560px) 100vw, 2560px" /></figure>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>いかがでしたか？</p>



<p>この記事では「多重代入法（多重補完法）をわかりやすく解説！EZRでは実施できる？」ということでお伝えしました。</p>



<p>多重代入法（Multiple Imputation）は、医療系の論文でよく使われる方法。</p>



<ol class="wp-block-list">
<li><strong>多重代入法とは欠測値（欠損値）に対応する方法である</strong></li>



<li><strong>多重代入法の概念をわかりやすく解説</strong></li>



<li><strong>EZRで多重代入法はできる？</strong></li>
</ol>



<p>ということが理解できたのなら幸いです！！</p>
]]></content:encoded>
					
					<wfw:commentRss>https://best-biostatistics.com/summary/multiple_imputation.html/feed</wfw:commentRss>
			<slash:comments>0</slash:comments>
		
		
			</item>
		<item>
		<title>ポアソン分布とは？わかりやすく簡単に例を用いて二項分布との関係も</title>
		<link>https://best-biostatistics.com/summary/poisson.html</link>
					<comments>https://best-biostatistics.com/summary/poisson.html#comments</comments>
		
		<dc:creator><![CDATA[beat1115]]></dc:creator>
		<pubDate>Thu, 02 Apr 2026 22:00:26 +0000</pubDate>
				<category><![CDATA[データを解析しよう]]></category>
		<guid isPermaLink="false">https://best-biostatistics.com/?p=2351</guid>

					<description><![CDATA[<p><img src="https://best-biostatistics.com/wp/wp-content/uploads/2022/03/統計のYoutubeアイキャッチ-6-1024x576.jpg" class="webfeedsFeaturedVisual" /></p>正規分布や二項分布、カイ二乗分布の他に、統計学でよく出てくる分布にポアソン分布が存在します。 ポアソン分布は、「ランダムに起きる事象」がある期間に何回起こるかの確率を調べるときに用いる分布です。 ポアソン分布とはどのよう [&#8230;]]]></description>
										<content:encoded><![CDATA[<p><img src="https://best-biostatistics.com/wp/wp-content/uploads/2022/03/統計のYoutubeアイキャッチ-6-1024x576.jpg" class="webfeedsFeaturedVisual" /></p>
<p><a href="https://best-biostatistics.com/summary/normal_dist.html">正規分布</a>や<a href="https://best-biostatistics.com/contingency/binomial.html">二項分布</a>、カイ二乗分布の他に、統計学でよく出てくる分布にポアソン分布が存在します。</p>



<p>ポアソン分布は、「ランダムに起きる事象」がある期間に何回起こるかの確率を調べるときに用いる分布です。</p>



<p>ポアソン分布とはどのような分布なのでしょうか。</p>



<p>この記事ではポアソン分布について簡単にわかりやすく説明していきます。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">ポアソン分布とは？わかりやすく解説！</h2>


<div class="wp-block-image">
<figure class="aligncenter"><img decoding="async" width="640" height="427" src="https://best-biostatistics.com/wp/wp-content/uploads/2019/11/a1da5ef0ce44877f9b66d512f4762577_s.jpg" alt="ポアソン分布をわかりやすく解説" class="wp-image-2487" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2019/11/a1da5ef0ce44877f9b66d512f4762577_s.jpg 640w, https://best-biostatistics.com/wp/wp-content/uploads/2019/11/a1da5ef0ce44877f9b66d512f4762577_s-300x200.jpg 300w" sizes="(max-width: 640px) 100vw, 640px" /></figure>
</div>


<p><strong><span class="marker">ポアソン分布は、ある事象がある期間に生じる確率を表す分布です。</span></strong></p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>例えばある県内で、自転車事故が一日あたり、人口10万人あたり5件発生したとします。</p>



<p>では、人口10万人あたり1年間で生じる自転車事故の確率は、どうなるでしょうか。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>このような問題はある”事象”を考えます。</p>



<p>上記の例で事象とは、「事故が生じるか生じないか」ということ。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>このような考え方は、以前にも出てきました。</p>



<p>コインの表と裏のような物事を表す分布、<strong><span class="marker">二項分布</span></strong>でしたね。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>ポアソン分布の事象はコインの表と裏のように、ある事象が起こるか、起こらないかの２通りあるで考えることができます。</p>



<p>そのため、<strong><span class="marker">ポアソン分布の基本となるのは、二項分布の考え方です。</span></strong></p>



<p>&gt;&gt;&gt;<a href="https://best-biostatistics.com/contingency/binomial.html">二項分布とは？初心者にもわかりやすく正規分布に近似できる問題も解説</a></p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>二項分布について、非常に簡単におさらいしていきます。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading">ポアソン分布を理解するための復習: 二項分布</h3>



<p>二項分布はコインの表と裏のように2通りの結果が生じる事象を繰り返して行なったときの分布でしたね。</p>



<p>2通りの結果が生じる事象を繰り返して行うことをベルヌーイ試行と呼びます。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>ここで一番、思い出して欲しいのは、</p>



<p>二項分布では期待値（平均）はとても簡単に計算できることです。</p>



<p>二項分布の期待値は</p>



<p class="has-text-align-center"><span style="font-size: 16px; color: #ff0000;"><strong>二項分布の期待値 = 試行回数 x 成功する確率 = n x p</strong></span></p>



<p>でした。</p>



<p>&gt;&gt;&gt;<a href="https://best-biostatistics.com/contingency/binomial.html">二項分布とは？初心者にもわかりやすく正規分布に近似できる問題も解説</a></p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>先ほどの自転車事故の例では、</p>



<p class="has-text-align-center"><strong>人口10万人あたりの一年間の事故の発生確率の期待値</strong></p>



<p class="has-text-align-center"><strong>=365日 x 人口10万人あたりの一日の事故の発生回数（件数）</strong></p>



<p>と同じように求めることができます。</p>



<p>（*ただし、冬場は事故が多いなどは無視して、1年中同じ確率で事故が発生すると仮定しています。）</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>二項分布の分散は</p>



<p class="has-text-align-center"><span style="font-size: 16px; color: #ff0000;"><strong>二項分布の分散 = n x p x (1 −&nbsp;p)</strong></span></p>



<p>でしたね。</p>



<p>この考え方がポアソン分布でも用いることができます。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading">ポアソン分布は二項分布の極限！λは何を意味する？</h3>



<p>では、ポアソン分布の確率関数P(k)はどのようにして求めることができるのでしょうか。</p>



<p>実は、ポアソン分布は<a href="https://best-biostatistics.com/contingency/binomial.html">二項分布</a>の極限として求めることができるのです。</p>



<p>単位時間あたり平均λ回起こる事象が、単位時間あたりk回発生し、この確率をP(k)とする。</p>



<div class="simple-box4">
<ol>
<li>ある事象が起こる確率がλ／nであるような独立な試行をn回行った場合、この事象が起こる回数の期待値は、λ／n×n＝λとなりnによらないλという数になる。</li>
<li>n回の試行のうちある事象がk回起こる確率は、1回の試行である事象が起こる確率がλ／n、1回の試行でこの事象が起こらない確率が1－λ／nなので、λ／nのk乗と1－λ／nのn－k乗の積にn回の試行のうち、ある事象がk回起こる選び方の総数（二項係数）をかけ合わせたものになる。</li>
<li>試行回数nを∞としたものがP(k)となる。</li>
</ol>
</div>



<p>具体的に数式を用いて計算すると以下のようになります。</p>



<figure class="wp-block-image"><img decoding="async" width="525" height="509" src="https://best-biostatistics.com/wp/wp-content/uploads/2020/07/-5-e1596247883366.png" alt="" class="wp-image-3775" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2020/07/-5-e1596247883366.png 525w, https://best-biostatistics.com/wp/wp-content/uploads/2020/07/-5-e1596247883366-300x291.png 300w" sizes="(max-width: 525px) 100vw, 525px" /></figure>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>ちなみにeはネイピア数または自然対数の底と呼ばれる定数で、e=2.718281828459045235360287471352・・・と無限に続く値。</p>



<p>ネイピア数を含む上の算式がポアソン分布の確率関数の具体的な算式です。</p>



<p>λが0.1、1.5、5の場合のポアソン分布のグラフを作るとこんな感じ。</p>



<figure class="wp-block-image"><img decoding="async" width="1457" height="856" src="https://best-biostatistics.com/wp/wp-content/uploads/2020/07/2-3-e1596249909603.png" alt="" class="wp-image-3780" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2020/07/2-3-e1596249909603.png 1457w, https://best-biostatistics.com/wp/wp-content/uploads/2020/07/2-3-e1596249909603-300x176.png 300w, https://best-biostatistics.com/wp/wp-content/uploads/2020/07/2-3-e1596249909603-1024x602.png 1024w, https://best-biostatistics.com/wp/wp-content/uploads/2020/07/2-3-e1596249909603-768x451.png 768w" sizes="(max-width: 1457px) 100vw, 1457px" /></figure>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>このグラフから分かることは、</p>



<p><span style="color: #ff0000;"><strong>１．λが大きいと右にシフトする</strong></span></p>



<p><span style="color: #ff0000;"><strong>２．λが小さいと急激に下がって0近くにへばりつく</strong></span></p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>例えば、上のポアソン分布が1日あたり交通事故の発生回数の分布だとしましょう。</p>



<div class="simple-box4">
<p>1日あたり交通事故の発生回数が平均0.1回のポアソン分布にしたがう場合に、1日に2回交通事故の発生する確率は、ほぼ0。</p>
<p>1日あたり交通事故の発生回数が平均0.5回のポアソン分布にしたがう場合に、1日に2回交通事故の発生する確率は、ほぼ0.26くらい。</p>
<p>1日あたり交通事故の発生回数が平均5回のポアソン分布にしたがう場合に、1日に2回交通事故の発生する確率は、0.075くらいであることが上のグラフから読み取れます。</p>
</div>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>不思議なことに上のグラフの3例の中では、1日あたり交通事故の発生回数が平均1.5回のポアソン分布にしたがう場合において、1日に2回交通事故の発生する確率が一番高くなった。</p>



<p>要するに平均と近い回数の確率が高くなる傾向にあるということ。</p>



<p>ポアソン分布にしたがう現象の確率の求め方がお分かりになりましたか。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>つまり二項分布とポアソン分布の違いをわかりやすくお伝えすると、「<strong><span style="text-decoration: underline;">上限（n）が決まっている場合は二項分布、上限が決まっていない（無限大と考えられる）場合はポアソン分布</span></strong>」という使い分けが良いです。</p>



<p>例えば、コイン投げは10回という上限があるから二項分布。1日の来店者数は理論上上限がないからポアソン分布を考えることになります。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading">ポアソン分布をエクセルで確認してみよう</h3>



<p>例えばマイクロソフトのエクセルでポアソンの確率関数を計算するには、POISSON.DIST(回数,平均,FALSE)という関数を使えば簡単に求められます。</p>



<p>時間がある方は是非やってみてください。</p>



<p>確率関数の形も、ネイピア数のマイナス<span style="letter-spacing: 0.8px;">λ乗</span><span style="font-size: 1em; letter-spacing: 0.05em;">と<span style="letter-spacing: 0.8px;">λのk乗の積をkの階乗で割っただけのものですから、簡単に計算できますよね。</span></span></p>



<p>簡単な割にいろいろな現実の問題に適用できて便利なのです。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">ポアソン分布が適用できるデータの例は？</h2>



<p>ポアソン分布は、ある事象の起こりやすさがランダムで生じると仮定したときに、</p>



<p><strong>「単位時間あたり平均λ回生じる事象が、単位時間にk回生じる確率」</strong>を表すのに用いる確率分布です。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>先ほどの自転車事故の例では、</p>



<p class="has-text-align-center"><strong>人口10万人あたりの一年間の事故の発生確率の期待値（λ）</strong></p>



<p class="has-text-align-center"><strong>=365日 (n) x 人口10万人あたりの一日の事故の発生確率 (p)</strong></p>



<p>となります。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>上の例のように、<strong><span class="marker">nが大きく、pが小さいときλは一定と考えることができます。</span></strong></p>



<p>1年あたり車の通る台数（n）はかなり大きいですが、事故の発生確率（p）は小さいですからね。</p>



<p>このとき、<strong><span class="marker">ある期間でλ回発生する事象が、一定時間にk回発生する確率がポアソン分布となります。</span></strong></p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>つまり、ポアソン分布はこのようにいうことができます。</p>



<div class="concept-box1">
<p><strong>ポアソン分布は、二項分布の試行回数nが十分に大きく、確率が非常に小さいとき、従う分布。</strong></p>
</div>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading">ポアソン分布の性質</h3>



<p>次にポアソン分布の性質を説明していきます。</p>



<p>ポアソン分布も元は二項分布でしたよね。</p>



<p>そのため、k回生じたのkは整数の値をとります。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>また、次に2つの性質があります。</p>



<ul class="wp-block-list">
<li><strong>ポアソン分布の期待値（平均）はλ</strong></li>



<li><strong>ポアソン分布の分散はλ</strong></li>
</ul>



<p>少しユニークですね。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>期待値がλになるのは先ほど見た通りです。</p>



<p>分散がλになるのは、二項分布の分散、</p>



<p class="has-text-align-center"><span style="font-size: 16px;"><strong>二項分布の分散 = n x p x (1 −&nbsp;p)</strong></span></p>



<p>から、考えることができます。</p>



<p>ポアソン分布の条件であるpが十分に小さいとき、</p>



<p class="has-text-align-center">(1 − p) 〜 1</p>



<p>になります。</p>



<p>そのため、</p>



<p class="has-text-align-center"><span style="font-size: 16px;"><strong>ポアソン分布の分散 = n x p x (1 −&nbsp;p)　= n x p x 1 = n x p =　λ</strong></span></p>



<p>となります。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>さらに、ポアソン分布の最頻値はλ以下の最大の整数となります。</p>



<p>これは、λは整数以外の値をとるためです。</p>



<p>もし、λが整数ならλが最頻値をとります。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading">ポアソン分布と間違え注意: ピアソン</h3>



<p>ポアソン分布とよく似た語幹の用語に、ピアソンがあります。</p>



<p>ピアソンは、ピアソンの相関係数でよく出てきます。</p>



<p>&gt;&gt;&gt;<a href="https://best-biostatistics.com/correlation_regression/correlation.html">相関係数とは？p値や有意差をどう解釈すれば良いのかわかりやすく！</a></p>



<p>たまに、ピアソンとポアソンを混乱することがあるので、気をつけましょう。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">ポアソン分布はどのようなときに使うのか？</h2>



<p>ポアソン分布はどのようなときに出てくるのかを考えていきます。</p>



<p>ポアソン分布の例でよく出てくるのは、不運にも事故に遭遇する回数です。</p>



<p>また、病気に疾患する確率や、不良品の割合など、世の中で発生する様々な事象に用いられています。</p>



<p>そのため、とても実用的な分布です。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">ポアソン分布の期待値（平均）と分散はどうなっている？</h2>



<figure class="wp-block-image"><img decoding="async" width="1280" height="704" src="https://best-biostatistics.com/wp/wp-content/uploads/2020/09/なぜ_1599012104.jpg" alt="" class="wp-image-4188" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2020/09/なぜ_1599012104.jpg 1280w, https://best-biostatistics.com/wp/wp-content/uploads/2020/09/なぜ_1599012104-300x165.jpg 300w, https://best-biostatistics.com/wp/wp-content/uploads/2020/09/なぜ_1599012104-1024x563.jpg 1024w, https://best-biostatistics.com/wp/wp-content/uploads/2020/09/なぜ_1599012104-768x422.jpg 768w" sizes="(max-width: 1280px) 100vw, 1280px" /></figure>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<div class="concept-box1">
<p><strong>ポアソン分布の期待値（平均）はポアソン分布の定義から明らか</strong></p>
</div>



<p>ポアソン分布の期待値(平均値)を求めるために、まず、期待値(expctation)というものについて理解しましょう。</p>



<p>ポアソン分布のような確率関数が離散的であるような確率分布の期待値は、確率変数と確率関数の積について定義域に亘って和をとったもののことです。</p>



<p>確率変数の分布を端的に示す指標といえる。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>ところが<span style="text-decoration: underline;"><strong>ポアソン分布の期待値は、上のような和の計算を行わなくても、実は定義から直感的に求めることができます。</strong></span></p>



<p>どういうことかと言うと、ポアソン分布とは平均してλ回ランダムに起こる事象が、単位時間にちょうどk回起きる確率の分布のことなので、<strong><span style="color: #ff0000;">λが期待値ということ</span></strong>。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>次に、分散について理解しましょう。</p>



<p>期待値だけでは、ある確率分布がどのくらいの広がりをもって分布しているのかがわからない。</p>



<p>そこで、平均の周りにどの程度分布するかの指標として分散 (variance) がある。</p>



<p>平均と合わせると、確率分布を測定するときの良い指標となる。</p>



<p>確率関数が離散的であるような確率分布の分散は、確率変数と平均との差の2乗と確率関数の積ついて定義域に亘って和をとったもののことです。</p>



<p>ただ、上の定義式のまま分散を計算しようとすると、かなりの計算量となる場合が多いので、分散の定義式を変形して、以下のような式にしてから分散を求める方が多少計算が楽になる。</p>



<p>分散＝確率変数の2乗の平均－確率変数の平均の2乗</p>



<p><strong>ポアソン分布の分散は、直感的には求まりませんが、上の定義に従って計算すると分散は期待値と同じλになります。</strong></p>



<p>すなわち、ポアソン分布の場合、イベントの平均的な発生回数λだけ、平均からぶれるということ。</p>



<div class="concept-box6">
<p><span style="font-size: 24px;"><strong>ポアソン分布の場合、平均値も分散もλとなる</strong></span></p>
</div>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">ポアソン分布の期待値（平均）と分散の求め方・証明は？</h2>



<div class="concept-box1">
<p><strong>ポアソン分布の期待値（平均）と分散の求め方は結構簡単</strong></p>
</div>



<p>ポアソン分布の期待値（平均）は、「確率変数と確率関数の積ついて定義域に亘って和をとったものの」という定義式に沿ってとにかくひたすら計算すると求まります。</p>



<p>では実際に計算してみましょう。</p>



<p>ポアソン分布の期待値（平均）は、</p>



<figure class="wp-block-image"><img decoding="async" width="1030" height="885" src="https://best-biostatistics.com/wp/wp-content/uploads/2020/07/3-1-e1596253856681.png" alt="" class="wp-image-3799" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2020/07/3-1-e1596253856681.png 1030w, https://best-biostatistics.com/wp/wp-content/uploads/2020/07/3-1-e1596253856681-300x258.png 300w, https://best-biostatistics.com/wp/wp-content/uploads/2020/07/3-1-e1596253856681-1024x880.png 1024w, https://best-biostatistics.com/wp/wp-content/uploads/2020/07/3-1-e1596253856681-768x660.png 768w" sizes="(max-width: 1030px) 100vw, 1030px" /></figure>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>上のような式変形だけで結構あっさり計算できる。</p>



<p>次に、ポアソン分布の分散は、確率変数と平均との差の2乗と確率関数の積について定義域に亘って和をとったもののですが、「ポアソン分布の期待値（平均）と分散はどうなっている？」で説明した必殺技である「分散＝確率変数の2乗の平均－確率変数の平均の2乗」を使って求めることにします。</p>



<figure class="wp-block-image"><img decoding="async" width="828" height="786" src="https://best-biostatistics.com/wp/wp-content/uploads/2020/07/4-3-e1596254753564.png" alt="" class="wp-image-3804" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2020/07/4-3-e1596254753564.png 828w, https://best-biostatistics.com/wp/wp-content/uploads/2020/07/4-3-e1596254753564-300x285.png 300w, https://best-biostatistics.com/wp/wp-content/uploads/2020/07/4-3-e1596254753564-768x729.png 768w" sizes="(max-width: 828px) 100vw, 828px" /></figure>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>よって、ポアソン分布の分散は</p>



<figure class="wp-block-image is-resized"><img decoding="async" width="894" height="637" src="https://best-biostatistics.com/wp/wp-content/uploads/2020/07/5-1-e1596255021579.png" alt="" class="wp-image-3807" style="aspect-ratio:1.4034798723360444;width:841px;height:auto" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2020/07/5-1-e1596255021579.png 894w, https://best-biostatistics.com/wp/wp-content/uploads/2020/07/5-1-e1596255021579-300x214.png 300w, https://best-biostatistics.com/wp/wp-content/uploads/2020/07/5-1-e1596255021579-768x547.png 768w" sizes="(max-width: 894px) 100vw, 894px" /></figure>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>と、平均も分散もλとなりました。</p>



<p>これはシンプルで覚えやすい。</p>



<p>ポアソン分布の平均も分散も高校数学レベルの和の計算をひたすら繰り返すことで求めることが出来ることがお分かりいただけたでしょうか。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">ポアソン分布に関してまとめ</h2>


<div class="wp-block-image">
<figure class="aligncenter"><img decoding="async" width="640" height="344" src="https://best-biostatistics.com/wp/wp-content/uploads/2019/11/53e0d72ad9bae4b1e39c3b1c6bf377dd_s-e1573554634921.jpg" alt="ポアソン分布に関してまとめ" class="wp-image-2320" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2019/11/53e0d72ad9bae4b1e39c3b1c6bf377dd_s-e1573554634921.jpg 640w, https://best-biostatistics.com/wp/wp-content/uploads/2019/11/53e0d72ad9bae4b1e39c3b1c6bf377dd_s-e1573554634921-300x161.jpg 300w" sizes="(max-width: 640px) 100vw, 640px" /></figure>
</div>


<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<ul class="wp-block-list">
<li>ポアソン分布は、「単位時間あたり平均λ回生じる事象が、単位時間にk回生じる確率」をあらわっす</li>



<li>ポアソン分布の基本は二項分布の考え方</li>



<li>二項分布でnが大きく、pが小さいときλは一定と考えることができ、このときポアソン分布に従う</li>



<li>ポアソン分布の期待値はλ</li>



<li>ポアソン分布の分散はλ</li>
</ul>
]]></content:encoded>
					
					<wfw:commentRss>https://best-biostatistics.com/summary/poisson.html/feed</wfw:commentRss>
			<slash:comments>1</slash:comments>
		
		
			</item>
		<item>
		<title>メタアナリシスとは？システマティックレビューとの違いや結果の見方を徹底解説</title>
		<link>https://best-biostatistics.com/summary/meta-sr.html</link>
					<comments>https://best-biostatistics.com/summary/meta-sr.html#respond</comments>
		
		<dc:creator><![CDATA[beat1115]]></dc:creator>
		<pubDate>Tue, 24 Feb 2026 00:50:28 +0000</pubDate>
				<category><![CDATA[データを解析しよう]]></category>
		<guid isPermaLink="false">https://best-biostatistics.com/?p=8757</guid>

					<description><![CDATA[<p><img src="https://best-biostatistics.com/wp/wp-content/uploads/2026/02/統計のYoutubeアイキャッチ-4-1024x576.png" class="webfeedsFeaturedVisual" /></p>メタアナリシスという言葉を耳にしたことはあるものの、「具体的にどのような手法なのか」「システマティックレビューとはどう違うのか」と疑問に感じている方は多いのではないでしょうか。 医学や公衆衛生をはじめとする多くの研究分野 [&#8230;]]]></description>
										<content:encoded><![CDATA[<p><img src="https://best-biostatistics.com/wp/wp-content/uploads/2026/02/統計のYoutubeアイキャッチ-4-1024x576.png" class="webfeedsFeaturedVisual" /></p>
<p>メタアナリシスという言葉を耳にしたことはあるものの、「具体的にどのような手法なのか」「システマティックレビューとはどう違うのか」と疑問に感じている方は多いのではないでしょうか。</p>



<p>医学や公衆衛生をはじめとする多くの研究分野において、メタアナリシスは非常に重要な役割を担っています。複数の研究結果を客観的かつ統計的に統合することで、単一の研究では得られない信頼性の高い結論を導き出すことができるからです。</p>



<p>本記事では、メタアナリシスの基本概念や実施するメリット、システマティックレビューとの明確な違いについて分かりやすく解説します。さらに、実際の手順や「フォレストプロット」の見方、「出版バイアス」といった結果を解釈する際の重要な注意点まで網羅的にまとめました。メタアナリシスの全体像を体系的に理解したい方は、ぜひ最後までご覧ください。</p>



<h2 class="wp-block-heading">メタアナリシスとは？基本概念と目的</h2>



<figure class="wp-block-image size-large"><img decoding="async" width="1024" height="572" src="https://best-biostatistics.com/wp/wp-content/uploads/2026/02/Gemini_Generated_Image_u97rs5u97rs5u97r-1024x572.jpg" alt="" class="wp-image-8758" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2026/02/Gemini_Generated_Image_u97rs5u97rs5u97r-1024x572.jpg 1024w, https://best-biostatistics.com/wp/wp-content/uploads/2026/02/Gemini_Generated_Image_u97rs5u97rs5u97r-300x167.jpg 300w, https://best-biostatistics.com/wp/wp-content/uploads/2026/02/Gemini_Generated_Image_u97rs5u97rs5u97r-768x429.jpg 768w, https://best-biostatistics.com/wp/wp-content/uploads/2026/02/Gemini_Generated_Image_u97rs5u97rs5u97r-1536x857.jpg 1536w, https://best-biostatistics.com/wp/wp-content/uploads/2026/02/Gemini_Generated_Image_u97rs5u97rs5u97r-2048x1143.jpg 2048w" sizes="(max-width: 1024px) 100vw, 1024px" /></figure>



<h3 class="wp-block-heading">メタアナリシスの定義と実施する目的・メリット</h3>



<p id="p-rc_5a766050977d10b7-71">結論から言うと、メタアナリシスとは「複数の独立した研究結果を、統計的手法を用いて定量的に統合し、全体的な効果を推定する分析方法」のことです。 過去に行われた類似するテーマの複数の研究データを集め、それらを数学的な手法で一つにまとめ上げることで、より信頼性の高い1つの結論を導き出そうとするのが主な目的です </p>



<p><strong><span style="text-decoration: underline;">メタアナリシスを実施する最大のメリットは、個々の研究の限界を補い、真の治療効果や要因の影響をより正確に評価できる点にあります</span></strong>。 </p>



<p>例えば、ある新薬の効果を検証した小規模な研究Aと研究Bがあったとします。小規模な研究だけではデータのばらつきが大きく、偶然によって結果が左右されるリスクがあります。<br>しかし、これらを統合し、サンプルサイズが十分な大規模データとして解析を行うことで、統計的な<a href="https://best-biostatistics.com/hypo_test/power.html" data-type="post" data-id="5152">検出力</a>が高まり、より真実に近い効果量（<a href="https://best-biostatistics.com/contingency/odds_risk.html" data-type="post" data-id="1015">リスク比やオッズ比</a>など）を導き出すことが可能になります。</p>



<p>つまり、メタアナリシスの目的は、個々の研究のばらつきを克服し、科学的かつ客観的な「最適解」を定量的に示すことにあるのです。</p>



<h3 class="wp-block-heading">なぜ「エビデンスレベル」が最も高いと言われるのか？</h3>



<p>医療や科学の分野では、研究手法によって得られた情報の信頼性を「エビデンスレベル（科学的根拠の強さ）」という階層で評価します。その中で、メタアナリシス（およびシステマティックレビュー）は、エビデンスレベルのピラミッドの頂点、すなわち最も信頼性が高い手法として位置づけられています。</p>



<figure class="wp-block-table"><table class="has-fixed-layout"><tbody><tr><td>エビデンスレベル</td><td>内容</td></tr><tr><td>レベルI</td><td>システマティック・レビューまたはランダム化比較試験のメタアナリシス</td></tr><tr><td>レベルII</td><td>１つ以上のランダム化比較試験</td></tr><tr><td>レベルIII</td><td>非ランダム化比較試験</td></tr><tr><td>レベルIVa</td><td>コホート研究</td></tr><tr><td>レベルIVb</td><td>症例対照研究、横断研究</td></tr><tr><td>レベルV</td><td>症例報告、ケースシリーズ</td></tr><tr><td>レベルVI</td><td>専門委員会や専門家個人の意見</td></tr></tbody></table></figure>



<p id="p-rc_5a766050977d10b7-72">その理由は、単一の研究結果や研究者の主観によるバイアス（偏り）を極限まで排除できる手法だからです。 </p>



<p id="p-rc_5a766050977d10b7-72">質の高い研究手法とされるランダム化比較試験（RCT）であっても、対象となった特定の集団や設定された条件に結果が依存してしまう可能性があります。</p>



<p id="p-rc_5a766050977d10b7-72">しかし、メタアナリシスでは、世界中で行われた複数の研究データを網羅的に集め、客観的な統計手法を用いて統合します。さらに、各研究の精度（サンプルサイズの大きさや標準誤差の小ささなど）に応じて適切な重みづけを行い、信頼性の高い研究結果ほど最終的な結論に大きく貢献するように計算されます。</p>



<p>様々な環境や集団で行われた複数の研究を厳密に統合することで、単一の研究では証明しきれなかった普遍的な事実（一般化可能性の高い結果）を提示できるため、メタアナリシスはエビデンスレベルが最も高いと評価されているのです。</p>



<p>＞＞<a href="https://best-biostatistics.com/design/evidence-level.html">エビデンスレベル（科学的根拠の強さ）のピラミッドや各研究デザインの信頼性について、さらに詳しく知りたい方はこちらの記事もご覧ください。</a></p>



<h2 class="wp-block-heading">システマティックレビューとの違いと国際的なガイドライン</h2>



<h3 class="wp-block-heading">システマティックレビュー（SR）とは？</h3>



<p>メタアナリシスと頻繁に混同されるのが「システマティックレビュー（Systematic Review: SR）」です。</p>



<p id="p-rc_5a766050977d10b7-73">システマティックレビューとは、特定のテーマ（リサーチクエスチョン）に関する既存の研究を、系統的かつ網羅的に収集・評価・統合する「包括的な文献レビュー手法」を指します。 あらかじめ定められた厳密な検索手順に従って世界中のデータベースから論文を検索し、研究の質（バイアスのリスクなど）を批判的に吟味した上で、得られた知見を整理します。システマティックレビューの特徴は、結果の統合が「定性的」であっても「定量的」であってもよい点にあります。つまり、データを数値でまとめられない場合でも、文章や表を用いて全体的な傾向を論理的にまとめることが可能なのです。</p>



<h3 class="wp-block-heading">メタアナリシスとシステマティックレビューの決定的な違い</h3>



<p>システマティックレビューとメタアナリシスの決定的な違いは、「統計的手法を用いて定量的な統合を行っているかどうか」にあります。</p>



<p id="p-rc_5a766050977d10b7-74">システマティックレビューが文献の系統的な収集と評価（定性的・定量的の両方を含む）という大きな枠組みであるのに対し、メタアナリシスは、常に定量的な評価を実施し、主に統計的手法による結果の統合に焦点を当てた分析方法を指します。 </p>



<p id="p-rc_5a766050977d10b7-74">言い換えれば、メタアナリシスはシステマティックレビューのプロセスの中に含まれる「解析手法の一つ」です。</p>



<p id="p-rc_5a766050977d10b7-74">システマティックレビューの中で、複数の研究結果（効果量）が類似した指標で測定されており、統計的にまとめることが可能かつ適切であると判断された場合にのみ、メタアナリシスが実行されます。 </p>



<p id="p-rc_5a766050977d10b7-74">したがって、「システマティックレビューは行ったが、メタアナリシスは行わなかった」という論文は存在しますが、メタアナリシスを行うためには、その前提として必ずシステマティックレビューによる網羅的な文献収集が行われていなければなりません。</p>



<h3 class="wp-block-heading">報告の質を担保するガイドライン「PRISMA声明」とは</h3>



<p>システマティックレビューやメタアナリシスはエビデンスレベルが高いとされていますが、その質を担保するためには、研究プロセスが透明であり、客観的に評価可能でなければなりません。</p>



<p>そこで重要になるのが「<a href="https://www.lifescience.co.jp/yk/jpt_online/prisma/j20210831.pdf">PRISMA声明</a>」です。</p>



<p id="p-rc_5a766050977d10b7-75">PRISMA声明とは、システマティックレビューやメタアナリシスを報告する際に遵守すべき国際的なガイドラインです。</p>



<p id="p-rc_5a766050977d10b7-75">研究者はPRISMA声明に従い、「どのようなデータベースを、どのような検索式で検索したのか」「どのような基準で論文を採択・除外したのか」といった使用した方法論や選択基準を論文内に明確に記述する必要があります。</p>



<p id="p-rc_5a766050977d10b7-75">これにより、他の研究者が同じ手順を再現し、結果の妥当性を検証することが可能になります。 現在、質の高い医学雑誌の多くは、メタアナリシスの論文投稿においてこのPRISMA声明の遵守を必須条件としています。</p>



<h2 class="wp-block-heading">メタアナリシスのやり方・手順</h2>



<h3 class="wp-block-heading">1. 研究課題の設定と文献の網羅的な収集・選択</h3>



<p>メタアナリシスのやり方は、大きく分けて「事前の文献収集」と「統計解析」のフェーズに分かれます。</p>



<p>最初のステップは、明確な研究課題（リサーチクエスチョン）の設定です。</p>



<p>一般的には「PICO（Patient：対象患者、Intervention：介入、Comparison：比較対照、Outcome：結果）」というフレームワークを用いて検証したいテーマを具体化します。 </p>



<p>次に、この設定に基づいて検索式を作成し、PubMedなどの主要なデータベースから関連する文献を網羅的に収集します。</p>



<p>その後、あらかじめ定めた包含基準と除外基準に沿って、タイトルや抄録のスクリーニング、さらには本文の精読を行い、最終的にメタアナリシスに組み込む研究を厳選します。</p>



<h3 class="wp-block-heading">2. データの抽出と統計学的な統合（解析）</h3>



<p>対象となる研究が選定されたら、各論文から必要なデータ（サンプルサイズ、イベント発生数、平均値など）を抽出します。そして、抽出したデータを用いて統計学的な統合を行います。</p>



<p id="p-rc_5a766050977d10b7-76">データの統合には、各研究の「効果量（オッズ比、リスク比など）」と「精度の指標」を用いて、それらを統合した全体効果量を算出します。 </p>



<p id="p-rc_5a766050977d10b7-76">このとき、各研究結果のばらつき（異質性）を考慮して統計モデルを選択します。各研究が全く同じ母集団から抽出されたと仮定する「固定効果モデル」と、研究ごとに結果が大きく異なっていることを前提とし、そのばらつきを許容する「変量効果モデル」があります。</p>



<p id="p-rc_5a766050977d10b7-76">医療分野のように、研究が行われた環境や患者の背景が微妙に異なる場合は、より柔軟な「変量効果モデル」が採用されることが多くなっています。</p>



<p>＞＞<a href="https://best-biostatistics.com/ezr/meta-analysis.html">無料の統計ソフト『EZR』を使って実際にメタアナリシスを行う手順や、データセットの作り方については、こちらの記事で詳しく解説しています。</a></p>



<h2 class="wp-block-heading">メタアナリシスの結果の見方と重要な注意点</h2>



<h3 class="wp-block-heading">結果を視覚化する「フォレストプロット」の見方</h3>



<p id="p-rc_5a766050977d10b7-77">メタアナリシスの結果は、「フォレストプロット」と呼ばれる特徴的なグラフを用いて視覚的に提示されます。論文を読む際は、このグラフの見方を理解しておくことが必須です。</p>



<p id="p-rc_5a766050977d10b7-78">フォレストプロットでは、縦軸に統合した各研究の名前が並び、横軸に効果量（オッズ比やリスク比など）が示されます。下記がフォレストプロットの一例です。</p>



<figure class="wp-block-image size-large"><img decoding="async" width="1024" height="662" src="https://best-biostatistics.com/wp/wp-content/uploads/2026/02/image-1024x662.png" alt="" class="wp-image-8759" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2026/02/image-1024x662.png 1024w, https://best-biostatistics.com/wp/wp-content/uploads/2026/02/image-300x194.png 300w, https://best-biostatistics.com/wp/wp-content/uploads/2026/02/image-768x496.png 768w, https://best-biostatistics.com/wp/wp-content/uploads/2026/02/image.png 1125w" sizes="(max-width: 1024px) 100vw, 1024px" /></figure>



<p id="p-rc_5a766050977d10b7-78">各研究の結果は、四角い「箱」とそこから伸びる「横線」で描かれます。箱の位置がその研究の効果量の点推定値を示し、箱の大きさがその研究の重みを表します。横線は95%信頼区間を示しています。 </p>



<p id="p-rc_5a766050977d10b7-78">そして、プロットの一番下にある「ひし形」が、全研究を統合した最終的な効果量（メタアナリシスの結果）です。このひし形が、効果がないことを示す基準線（リスク比やオッズ比なら「1」、平均値の差なら「0」の縦線）と交わっていなければ、「統計的に有意な差がある」と判断することができます。</p>



<h3 class="wp-block-heading">結果を歪めるリスク「出版バイアス」とは</h3>



<p id="p-rc_5a766050977d10b7-79">メタアナリシスの結果を解釈する上で、最も警戒すべき落とし穴が「出版バイアス」です。 </p>



<p id="p-rc_5a766050977d10b7-79">出版バイアスとは、「統計的に有意な結果や肯定的な結果が出た研究の方が、そうでない研究（有意差なし、否定的な結果）よりも学術雑誌に掲載（出版）されやすい傾向」のことです。 </p>



<p id="p-rc_5a766050977d10b7-79">仮に、新薬の効果がないことを示す研究が存在していても、それらが出版されずにお蔵入りになっていれば、メタアナリシスを行う際に入手可能な論文は「効果があった」とするものばかりに偏ってしまいます。</p>



<p id="p-rc_5a766050977d10b7-79">その結果、統合された効果量が実際の効果よりも過大評価される方向に歪んでしまう危険性があるのです。</p>



<p id="p-rc_5a766050977d10b7-80">出版バイアスの有無を視覚的に調べるためには、「ファンネルプロット」というグラフが用いられます。</p>



<p id="p-rc_5a766050977d10b7-80">これは縦軸に研究の精度（サンプルサイズなど）、横軸に効果量をとった散布図で、出版バイアスがなければ点は逆さまの漏斗（ファンネル）のように左右対称に分布すると期待されます。</p>



<p id="p-rc_5a766050977d10b7-80">非対称な分布が見られる場合は出版バイアスの存在が疑われ、Egger検定などの統計手法を用いてさらに定量的に評価が行われます。</p>



<p>＞＞<a href="https://best-biostatistics.com/design/publication-bias.html">出版バイアスが起きてしまう原因や、ファンネルプロットを用いた具体的な評価方法については、こちらの記事で分かりやすくまとめています。</a></p>



<h3 class="wp-block-heading">研究間のばらつきを示す「異質性」への配慮</h3>



<p id="p-rc_5a766050977d10b7-81">最後に確認すべき重要なポイントが「異質性」です。 </p>



<p id="p-rc_5a766050977d10b7-81">異質性とは、統合の対象となったそれぞれの研究で得られた効果の大きさが、研究間でどれくらい「ばらついているか」「異なっているか」の度合いを示しています。 </p>



<p id="p-rc_5a766050977d10b7-81">研究のデザインや対象患者の背景などが研究ごとに異なると、結果にも大きなばらつきが生じます。<strong><span style="text-decoration: underline;">異質性は主に「I^2（アイ二乗）統計量」という指標で評価され、一般的に25%以下なら異質性が低く、25〜50%で中等度、50〜75%で高度、75%以上で極めて高度な異質性があると判断されます</span></strong>。 </p>



<p id="p-rc_5a766050977d10b7-81">もし高度な異質性が見られる場合、そもそもそれらの研究を一つに統合すること自体が適切でなかった可能性や、結果の解釈を慎重に行う必要性が生じます。</p>



<h2 class="wp-block-heading">まとめ</h2>



<p>メタアナリシスは、複数の研究結果を統計的に統合し、科学的に最も信頼性の高いエビデンスを提供する強力なツールです。システマティックレビューによる厳密な文献収集を基盤とし、PRISMA声明などのガイドラインを遵守することで、その質と透明性が担保されます。</p>



<p>一方で、フォレストプロットによる正しい結果の解釈や、出版バイアス、異質性といった限界や注意点を理解しておくことも欠かせません。本記事で解説した基本概念や手順、結果の見方を身につけることで、専門的な医学論文や研究データをより深く、正確に読み解くことができるようになるでしょう。</p>
]]></content:encoded>
					
					<wfw:commentRss>https://best-biostatistics.com/summary/meta-sr.html/feed</wfw:commentRss>
			<slash:comments>0</slash:comments>
		
		
			</item>
		<item>
		<title>リッカート尺度の分析方法｜5件法は連続変数か順序尺度か？</title>
		<link>https://best-biostatistics.com/summary/likert.html</link>
					<comments>https://best-biostatistics.com/summary/likert.html#respond</comments>
		
		<dc:creator><![CDATA[beat1115]]></dc:creator>
		<pubDate>Thu, 12 Feb 2026 00:39:57 +0000</pubDate>
				<category><![CDATA[データを解析しよう]]></category>
		<guid isPermaLink="false">https://best-biostatistics.com/?p=8747</guid>

					<description><![CDATA[<p><img src="https://best-biostatistics.com/wp/wp-content/uploads/2026/02/統計のYoutubeアイキャッチ-3-1024x576.jpg" class="webfeedsFeaturedVisual" /></p>アンケート調査や臨床研究において、心理的な態度や主観的な評価を測定するために頻繁に使用されるのが「リッカート尺度」です。「非常に満足」から「非常に不満」までといった選択肢を用意し、回答者に自身の考えに最も近いものを選んで [&#8230;]]]></description>
										<content:encoded><![CDATA[<p><img src="https://best-biostatistics.com/wp/wp-content/uploads/2026/02/統計のYoutubeアイキャッチ-3-1024x576.jpg" class="webfeedsFeaturedVisual" /></p>
<p>アンケート調査や臨床研究において、心理的な態度や主観的な評価を測定するために頻繁に使用されるのが「リッカート尺度」です。「非常に満足」から「非常に不満」までといった選択肢を用意し、回答者に自身の考えに最も近いものを選んでもらうこの形式は、多くの研究者にとって馴染み深いものでしょう。</p>



<p>しかし、いざ集まったデータを分析する段階になると、多くの人が一つの大きな壁にぶつかります。それは、「このデータを数値（連続変数）として扱って平均値を出し、t検定などを行ってもよいのか？ それとも順序尺度（カテゴリカルデータ）として厳密に扱うべきなのか？」という問題です。</p>



<p>結論から言えば、この問いに「絶対的な正解」はありません。研究の目的やデータの性質、そしてその分野の慣習によって適切なアプローチは異なります。しかし、それぞれの方法が持つ統計学的な意味やリスクを理解せずに安易に手法を選択することは、誤った結論を導く原因となりかねません。</p>



<p>本記事では、リッカート尺度データの性質を深く掘り下げた上で、2つの主要な分析アプローチ（順序尺度としての分析、連続変数としての分析）について、それぞれのメリット・デメリットを解説します。これを読めば、あなたの研究に最適な統計手法を選ぶための判断基準が得られるはずです。</p>



<hr class="wp-block-separator has-alpha-channel-opacity"/>



<h2 class="wp-block-heading">リッカート尺度とは？ 4件法・5件法のデータの性質</h2>



<figure class="wp-block-image size-large"><img decoding="async" width="1024" height="353" src="https://best-biostatistics.com/wp/wp-content/uploads/2026/02/Gemini_Generated_Image_bv7s5ibv7s5ibv7s-e1770856595539-1024x353.jpg" alt="" class="wp-image-8748" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2026/02/Gemini_Generated_Image_bv7s5ibv7s5ibv7s-e1770856595539-1024x353.jpg 1024w, https://best-biostatistics.com/wp/wp-content/uploads/2026/02/Gemini_Generated_Image_bv7s5ibv7s5ibv7s-e1770856595539-300x103.jpg 300w, https://best-biostatistics.com/wp/wp-content/uploads/2026/02/Gemini_Generated_Image_bv7s5ibv7s5ibv7s-e1770856595539-768x265.jpg 768w, https://best-biostatistics.com/wp/wp-content/uploads/2026/02/Gemini_Generated_Image_bv7s5ibv7s5ibv7s-e1770856595539-1536x530.jpg 1536w, https://best-biostatistics.com/wp/wp-content/uploads/2026/02/Gemini_Generated_Image_bv7s5ibv7s5ibv7s-e1770856595539-2048x706.jpg 2048w" sizes="(max-width: 1024px) 100vw, 1024px" /></figure>



<p>リッカート尺度（Likert scale）は、主に心理学や社会調査、医療研究などで用いられる測定尺度の一つです。回答者に対して特定の質問文を提示し、それに対する同意や評価の程度を段階的な選択肢で尋ねる形式をとります。一般的には、「全くそう思わない」から「非常にそう思う」といった形容語句が用いられます。</p>



<p>分析手法を検討する前に、まずはこのデータの基本的な性質について理解を深めましょう。</p>



<h3 class="wp-block-heading">順序尺度としての性質：「間隔は等しい」とは限らない</h3>



<p id="p-rc_babad0a5065ae3a7-57">リッカート尺度は、本質的には「順序尺度（順序カテゴリカルデータ）」に分類されます 。順序尺度とは、選択肢の間に明確な順序（大小関係）は存在するものの、その「間隔」が数値的に等しいとは限らないデータを指します。</p>



<p>例えば、ある製品の満足度を以下の5段階で尋ねたとします。</p>



<ol start="1" class="wp-block-list has-swl-gray-background-color has-background">
<li>非常に不満</li>



<li>やや不満</li>



<li>どちらともいえない</li>



<li>やや満足</li>



<li>非常に満足</li>
</ol>



<p id="p-rc_babad0a5065ae3a7-58">このとき、便宜上「1点、2点、3点&#8230;」と数値を割り振ることはよくあります。しかし<strong><span style="text-decoration: underline;">、回答者の心理において、「非常に不満（1点）」と「やや不満（2点）」の間の心理的な距離（1点差）が、「やや満足（4点）」と「非常に満足（5点）」の間の距離（1点差）と完全に等しい保証はどこにもありません</span></strong> 。</p>



<p>温度計の目盛りであれば、10℃と11℃の差は、20℃と21℃の差と同じ熱エネルギーの違いを意味します（これは間隔尺度や比率尺度です）。</p>



<p>しかし、リッカート尺度における「1点の差」は、あくまで便宜的なものであり、数学的に厳密な等間隔性を保証するものではないのです。この性質が、後の分析手法の選択において大きな論点となります。</p>



<h3 class="wp-block-heading">4件法と5件法の違い：中立的な選択肢の有無</h3>



<p>リッカート尺度には、選択肢の数によっていくつかのバリエーションがありますが、代表的なものが「4件法」と「5件法」です。</p>



<ul class="wp-block-list has-swl-gray-background-color has-background">
<li><strong>5件法（5-point scale）：</strong> 「どちらともいえない」「普通」といった<strong>中立的な選択肢</strong>が含まれます 。回答者が明確な意見を持っていない場合や、判断を保留したい場合に選択しやすいという特徴があります。データの分布としては、中央に回答が集まりやすくなる傾向があります。</li>



<li><strong>4件法（4-point scale）：</strong> 中立的な選択肢を排除し、回答者に肯定的か否定的かの<strong>どちらかの態度を強制</strong>する形式です。これを「強制的選択法」と呼ぶこともあります。日本人は「どちらともいえない」を選びがちであると言われることがありますが、4件法はそうした中心化傾向を防ぎ、意見の方向性を明確にするために用いられることがあります。</li>
</ul>



<p>どちらを採用するかは研究デザインによりますが、分析上の扱いは基本的に同じです。5件法であれば1〜5、4件法であれば1〜4の数値を割り当ててデータ化しますが、いずれも「順序尺度である」という根本的な性質は変わりません。</p>



<hr class="wp-block-separator has-alpha-channel-opacity"/>



<h2 class="wp-block-heading">リッカート尺度の分析アプローチ①：順序カテゴリカルデータとして厳密に分析する（基本原則）</h2>



<p id="p-rc_babad0a5065ae3a7-60">リッカート尺度が本質的に順序尺度である以上、統計学的に最も厳密で「本来あるべき姿」とされるのは、データを<strong>順序カテゴリカルデータ</strong>として扱うアプローチです <sup></sup>。このアプローチでは、数値の間隔に意味を持たせず、あくまで「順序（大小関係）」のみを利用して解析を行います。</p>



<h3 class="wp-block-heading">推奨される要約統計量：中央値と割合（%）</h3>



<p>データを連続変数（数値）として扱わない場合、要約統計量として「平均値」や「標準偏差」を算出することは適切ではありません。なぜなら、平均値は「足し算」や「割り算」の結果であり、間隔が等しいことを前提とした計算だからです。</p>



<p id="p-rc_babad0a5065ae3a7-61">その代わりに用いられるのが、<strong>「中央値（Median）」や「四分位範囲（IQR）」</strong>、あるいは各選択肢を選んだ人数の「度数」<strong>や</strong>「割合（%）」です 。</p>



<ul class="wp-block-list has-swl-gray-background-color has-background">
<li><strong>中央値：</strong> データを大きさの順に並べたときに、ちょうど真ん中にくる値です。例えば、5人の回答が「1, 1, 5, 5, 5」だった場合、平均値は3.4ですが、中央値は5になります。リッカート尺度のような偏りが出やすいデータや、外れ値の影響を受けやすいデータにおいて、中央値は集団の代表的な値をより適切に示すことができます 。</li>



<li><strong>割合（%）：</strong> 「満足と回答した人の割合（4点以上を選んだ人の割合）」などを算出します。これは直感的にも理解しやすく、順序尺度の性質を崩さずに結果を提示できる優れた方法です。</li>
</ul>



<p>論文やレポートでの記述例としては、「満足度は中央値4（四分位範囲：3-5）であった」や、「回答者の80%が肯定的評価（4または5）を選択した」といった表現が適切です。</p>



<h3 class="wp-block-heading">統計手法：順序ロジスティック回帰分析の活用</h3>



<p id="p-rc_babad0a5065ae3a7-63">では、要因分析や群間比較を行いたい場合はどうすればよいでしょうか。順序尺度としてデータを扱う場合に推奨される多変量解析の手法が、「順序ロジスティック回帰分析（Ordinal Logistic Regression）」です 。</p>



<p id="p-rc_babad0a5065ae3a7-64">順序ロジスティック回帰分析は、目的変数が3つ以上のカテゴリーを持ち、かつそれらに順序関係がある場合（例：不満 &lt; 普通 &lt; 満足）に特化した統計モデルです <sup></sup>。</p>



<p id="p-rc_babad0a5065ae3a7-65">通常のロジスティック回帰分析（二項ロジスティック回帰）が「イベントが起きるか否か（0か1か）」の2値を扱うのに対し、順序ロジスティック回帰は「あるカテゴリー以下になる確率（累積確率）」や「その起こりやすさ（累積オッズ）」に説明変数がどのように影響するかを分析します <sup></sup>。</p>



<p>例えば、「ある治療法を行った群（説明変数）は、行わなかった群に比べて、満足度（目的変数）が高いカテゴリーに属する傾向があるか」を検定することができます。この手法を用いれば、データの「間隔が等しくない」という性質を保ったまま、順序関係に基づいた妥当な推測を行うことが可能です。統計学的な厳密さを最優先するならば、この手法が第一選択となります。</p>



<hr class="wp-block-separator has-alpha-channel-opacity"/>



<h2 class="wp-block-heading">リッカート尺度の分析アプローチ②：連続変数として扱ってパラメトリック検定やノンパラメトリック検定を行う（現実的対応）</h2>



<p id="p-rc_babad0a5065ae3a7-66">一方で、実務や多くの研究現場では、リッカート尺度を「連続変数（連続量）」とみなして分析することが広く行われています。これは、便宜的に「1点と2点の間隔は、4点と5点の間隔と同じである」と仮定して計算を進めるアプローチです 。</p>



<p>なぜ、厳密には正しくないこの方法が頻繁に採用されるのでしょうか？ それには実用上の大きなメリットがあるからです。</p>



<h3 class="wp-block-heading">「間隔が等しい」と仮定して分析するメリット</h3>



<p id="p-rc_babad0a5065ae3a7-67">リッカート尺度を連続変数として扱う最大のメリットは、「パラメトリック検定」と呼ばれる強力で汎用性の高い統計手法が利用可能になる点です 。</p>



<ul class="wp-block-list has-swl-gray-background-color has-background">
<li><strong>平均値と標準偏差の算出：</strong> データの分布を一目で把握できる「平均値」や、ばらつきを示す「標準偏差」を計算できます。「満足度の平均は4.2点」といった表現は、中央値よりも直感的に微細な差を伝えやすい場合があります。</li>



<li><strong>t検定や分散分析（ANOVA）の利用：</strong> 2群間の比較には「t検定」、3群以上の比較には「分散分析（ANOVA）」といった、統計学の教科書で必ず登場する標準的な検定手法を適用できます。これらの手法は多くの研究者にとって馴染み深く、解釈もしやすいという利点があります。</li>



<li><strong>重回帰分析や共分散分析の適用：</strong> 他の連続変数（年齢や検査値など）と組み合わせて、より高度な多変量解析を行う際にも、連続変数扱いすることでモデルへの組み込みが容易になります。</li>
</ul>



<p>このように、連続変数として扱うことで、分析の選択肢が広がり、結果の解釈や伝達がスムーズになるという実利的な側面があります。</p>



<h3 class="wp-block-heading">連続変数扱いする際の注意点とリスク</h3>



<p id="p-rc_babad0a5065ae3a7-68">しかし、このアプローチには常にリスクが伴います。あくまで「間隔が等しいと仮定している」に過ぎないため、その仮定が現実と大きく乖離している場合、分析結果の信頼性が揺らぐ可能性があります <sup></sup>。</p>



<ol start="1" class="wp-block-list has-swl-gray-background-color has-background">
<li><strong>前提条件の不成立：</strong> パラメトリック検定（t検定など）は、データが「正規分布（左右対称の釣り鐘型の分布）」に従うことを前提としています。しかし、リッカート尺度のデータは、天井効果（全員が5を選ぶなど）や床効果によって分布が歪むことが多く、正規分布の仮定を満たさないケースが多々あります 。</li>



<li><strong>解釈の難しさ：</strong> 計算上「平均値 3.5」という結果が出たとしても、リッカート尺度において「3.5」という状態は現実には存在しません。「どちらともいえない（3点）」と「やや満足（4点）」の中間とは具体的にどのような心理状態なのか、厳密に定義することは困難です 。</li>



<li><strong>精度の低下：</strong> 本来は等間隔ではないデータを無理やり等間隔として扱うことで、データの持つ情報を歪めてしまい、本来あるはずの差を見逃したり（βエラー）、逆にないはずの差を有意としてしまったり（αエラー）するリスクも否定できません。</li>
</ol>



<p id="p-rc_babad0a5065ae3a7-71">したがって、連続変数として扱う場合には、「各選択肢が等間隔であると仮定した上で解析を行っている」という前提（リミテーション）を、研究者自身が常に意識しておく必要があります <sup></sup>。</p>



<p>＞＞<a href="https://best-biostatistics.com/toukei-er/entry/can-you-calculate-the-average-for-likert-scales-grounds-and-precautions-for-treating-them-as-continuous-data/">リッカート尺度は「平均」を出してもいい？連続データとして扱う根拠と注意点</a></p>



<hr class="wp-block-separator has-alpha-channel-opacity"/>



<h2 class="wp-block-heading">リッカート尺度の分析には結局どちらを選ぶべきか？ 適切な統計手法の選び方</h2>



<figure class="wp-block-image size-large"><img decoding="async" width="1024" height="572" src="https://best-biostatistics.com/wp/wp-content/uploads/2026/02/Gemini_Generated_Image_rd5hkjrd5hkjrd5h-1-1024x572.jpg" alt="" class="wp-image-8751" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2026/02/Gemini_Generated_Image_rd5hkjrd5hkjrd5h-1-1024x572.jpg 1024w, https://best-biostatistics.com/wp/wp-content/uploads/2026/02/Gemini_Generated_Image_rd5hkjrd5hkjrd5h-1-300x167.jpg 300w, https://best-biostatistics.com/wp/wp-content/uploads/2026/02/Gemini_Generated_Image_rd5hkjrd5hkjrd5h-1-768x429.jpg 768w, https://best-biostatistics.com/wp/wp-content/uploads/2026/02/Gemini_Generated_Image_rd5hkjrd5hkjrd5h-1-1536x857.jpg 1536w, https://best-biostatistics.com/wp/wp-content/uploads/2026/02/Gemini_Generated_Image_rd5hkjrd5hkjrd5h-1-2048x1143.jpg 2048w" sizes="(max-width: 1024px) 100vw, 1024px" /></figure>



<p>ここまで2つのアプローチを見てきましたが、結局のところ、自分の研究ではどちらを選べばよいのでしょうか。</p>



<h3 class="wp-block-heading">研究目的と先行研究との整合性で判断する</h3>



<p id="p-rc_babad0a5065ae3a7-72">どちらの方法を選ぶかに、絶対的な正解・不正解はありません。両者の特性を把握した上で、研究目的に応じて研究者自身が判断する必要があります <sup></sup>。判断の指針として以下のポイントを参考にしてください。</p>



<ol start="1" class="wp-block-list has-swl-gray-background-color has-background">
<li><strong>先行研究を確認する：</strong> あなたの研究分野（医学、心理学、社会学など）や、投稿を予定しているジャーナルにおいて、類似の研究がどのような手法を採用しているかを確認しましょう 。その分野で「リッカート尺度は連続変数としてt検定を行うのが通例」となっているのであれば、それに倣うことは合理的です。逆に、厳密さを重視する分野であれば、順序ロジスティック回帰などを選択すべきです。</li>



<li><strong>データの分布を確認する：</strong> ヒストグラムや箱ひげ図を作成し、データの分布を確認します 。もしデータが極端に偏っており、明らかに正規分布から外れている場合は、連続変数としての分析（パラメトリック検定）は避けたほうが無難です。その場合は、順序尺度として扱うか、ノンパラメトリック検定（マンホイットニーのU検定など）の利用を検討しましょう 。</li>



<li><strong>統計専門家への相談：</strong> 判断に迷う場合は、統計の専門家に相談しながら進めることを強くお勧めします 。</li>
</ol>



<p id="p-rc_babad0a5065ae3a7-76">また、結果の報告においては、「平均値と中央値を併記する」という方法も有効です 。パラメトリックな分析を行いつつも、ノンパラメトリックな要約統計量（中央値や四分位範囲）を併せて提示することで、データの分布特性を読者に誤解なく伝えることができます。</p>



<p>＞＞<a href="https://best-biostatistics.com/stat-test/w-test.html">ウィルコクソンの順位和検定とは？マンホイットニーのU検定との違いは？</a></p>



<h3 class="wp-block-heading">より精度の高い代替案：VAS（Visual Analogue Scale）の検討</h3>



<p id="p-rc_babad0a5065ae3a7-77">もし、これから研究を計画する段階であり、より精度の高い連続データが必要であるならば、リッカート尺度ではなくVAS（Visual Analogue Scale：視覚的アナログ尺度）の導入を検討するのも一つの手です 。</p>



<p>VASとは、例えば長さ100mmの直線を提示し、左端を「全くない（0）」、右端を「想像できる限り最大（100）」と定義して、回答者に自分の感覚に該当する位置に印をつけてもらう方法です。</p>



<p id="p-rc_babad0a5065ae3a7-78">回答者は「左端から何mm」という形で回答するため、得られるデータは0〜100の連続量となります。VASで得られたデータであれば、間隔や順序の悩みを抱えることなく、堂々と連続変数として扱い、平均値の算出やパラメトリック検定を行うことができます <sup></sup>。痛みの評価などでよく用いられる手法ですが、満足度や主観的な評価全般に応用可能です。</p>



<hr class="wp-block-separator has-alpha-channel-opacity"/>



<h2 class="wp-block-heading">まとめ</h2>



<p>リッカート尺度（4件法・5件法）の分析方法には、大きく分けて2つの道があります。</p>



<ol start="1" class="wp-block-list has-swl-gray-background-color has-background">
<li><strong>順序カテゴリカルデータとして扱う（厳密なアプローチ）：</strong>
<ul class="wp-block-list">
<li>要約には「中央値」や「割合」を用いる。</li>



<li>解析には「順序ロジスティック回帰分析」やノンパラメトリック検定を用いる。</li>



<li>統計学的な妥当性が高い。</li>
</ul>
</li>



<li><strong>連続変数として扱う（現実的なアプローチ）：</strong>
<ul class="wp-block-list">
<li>要約には「平均値」や「標準偏差」を用いる。</li>



<li>解析には「t検定」「分散分析」「重回帰分析」などのパラメトリック検定を用いる。</li>



<li>分析の選択肢が多く、解釈が直感的だが、「間隔が等しい」という仮定が必要。</li>
</ul>
</li>
</ol>



<p>どちらを選択するかは、データの分布状況、研究の目的、そして先行研究の慣例を総合的に判断して決定しましょう。重要なのは、選んだ手法の限界と前提条件を理解し、誠実に結果を報告することです。迷ったときは、VASのような代替手法の検討や、専門家への相談も視野に入れつつ、最適な分析計画を立ててください。</p>



<p>＞＞<a href="https://best-biostatistics.com/toukei-er/entry/ordered-logistic-regression-in-spss-how-to-calculate-odds-ratios/">SPSS で順序ロジスティック回帰を行う方法</a></p>




]]></content:encoded>
					
					<wfw:commentRss>https://best-biostatistics.com/summary/likert.html/feed</wfw:commentRss>
			<slash:comments>0</slash:comments>
		
		
			</item>
		<item>
		<title>内的妥当性と外的妥当性の違いは？予測研究で重要な妥当性の考え方</title>
		<link>https://best-biostatistics.com/summary/validation.html</link>
					<comments>https://best-biostatistics.com/summary/validation.html#respond</comments>
		
		<dc:creator><![CDATA[beat1115]]></dc:creator>
		<pubDate>Tue, 09 Sep 2025 21:42:04 +0000</pubDate>
				<category><![CDATA[データを解析しよう]]></category>
		<guid isPermaLink="false">https://best-biostatistics.com/?p=8583</guid>

					<description><![CDATA[<p><img src="https://best-biostatistics.com/wp/wp-content/uploads/2025/09/統計のYoutubeアイキャッチ-39-1024x576.png" class="webfeedsFeaturedVisual" /></p>この記事では、予測研究における内的妥当性と外的妥当性に関して、重要性や考え方をわかりやすくお伝えしています。 また、外的妥当性に関しては最近提案されている、Internal-External Cross Validati [&#8230;]]]></description>
										<content:encoded><![CDATA[<p><img src="https://best-biostatistics.com/wp/wp-content/uploads/2025/09/統計のYoutubeアイキャッチ-39-1024x576.png" class="webfeedsFeaturedVisual" /></p>
<p>この記事では、予測研究における内的妥当性と外的妥当性に関して、重要性や考え方をわかりやすくお伝えしています。</p>



<p>また、外的妥当性に関しては最近提案されている、Internal-External Cross Validationといった方法も含めて紹介します。</p>



<p>論文アクセプトに少しでも近付くように、本内容をぜひ理解しましょう！</p>



<h2 class="wp-block-heading">予測研究における妥当性の評価とは？内的妥当性と外的妥当性の違い</h2>



<p>予測研究において、モデルがどの程度「使える」のかを判断するためには、妥当性の評価が欠かせません。</p>



<p>単にモデルを構築するだけでは、その予測性能が信頼できるかどうかはわかりません。</p>



<p>そこで、内的妥当性（internal validation） と 外的妥当性（external validation） を区別し、それぞれの方法で評価を行う必要があります。</p>



<figure class="wp-block-image size-large"><img decoding="async" width="1024" height="423" src="https://best-biostatistics.com/wp/wp-content/uploads/2025/09/ScreenShot-2025-09-09-9.14.59-1024x423.png" alt="" class="wp-image-8585" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2025/09/ScreenShot-2025-09-09-9.14.59-1024x423.png 1024w, https://best-biostatistics.com/wp/wp-content/uploads/2025/09/ScreenShot-2025-09-09-9.14.59-300x124.png 300w, https://best-biostatistics.com/wp/wp-content/uploads/2025/09/ScreenShot-2025-09-09-9.14.59-768x317.png 768w, https://best-biostatistics.com/wp/wp-content/uploads/2025/09/ScreenShot-2025-09-09-9.14.59-1536x634.png 1536w, https://best-biostatistics.com/wp/wp-content/uploads/2025/09/ScreenShot-2025-09-09-9.14.59.png 1966w" sizes="(max-width: 1024px) 100vw, 1024px" /></figure>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading">内的妥当性の評価</h3>



<p>内的妥当性は、開発データあるいは同一集団の中でモデルがどれだけ予測力を発揮できているかを確認するものです。</p>



<p>つまり、モデルが開発時に用いたデータに対して過不足なくフィットしているかを評価するもの。</p>



<p>例えば、ある病気の発症を予測するために年齢・性別・血圧・喫煙歴を<a href="https://best-biostatistics.com/correlation_regression/variables.html" data-type="post" data-id="3156">説明変数</a>とした<a href="https://best-biostatistics.com/correlation_regression/logistic.html" data-type="post" data-id="5410">ロジスティック回帰モデル</a>を構築したとします。</p>



<p>このとき<span style="text-decoration: underline;">「内的妥当性が高い」とは、その研究で集められた対象者のデータに対して、モデルが適切に予測精度を発揮している状態を指します</span>。</p>



<p>主な方法は以下の通りです。</p>



<ol class="wp-block-list has-swl-main-thin-background-color has-background">
<li>見かけの予測能（apparent performance）
<ul class="wp-block-list">
<li>開発データそのものに対する予測能を評価する方法。</li>



<li><a href="https://best-biostatistics.com/surviv/c-statistics-c-index-guide.html" data-type="post" data-id="8545">AUC（C統計量）</a>やCalibration slope（予測確率と実測の整合性）を算出する。</li>



<li>ただし、開発データに最適化されているため、過大評価になりやすい。</li>
</ul>
</li>



<li>交差検証（<a href="https://best-biostatistics.com/correlation_regression/crossvalidation.html" data-type="post" data-id="4814">cross-validation</a>）
<ul class="wp-block-list">
<li>データを複数のサブセットに分割し、交互に学習と検証を行う方法。</li>



<li>開発集団の中での安定性を確認できる。</li>
</ul>
</li>



<li><a href="https://best-biostatistics.com/summary/bootstrap.html" data-type="post" data-id="5257">ブートストラップ法（bootstrapping）</a>
<ul class="wp-block-list">
<li>元データから再標本を繰り返し抽出し、そのたびにモデルを構築して性能を評価する。</li>



<li>モデルの過剰適合を補正した「optimism-corrected performance」を得られる。</li>
</ul>
</li>
</ol>



<p>これらの手法を通じて、開発データ内でのモデルの適切さを確認し、過剰適合のリスクを把握することが可能です。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading">外的妥当性の評価</h3>



<p>一方、外的妥当性とは「研究の外に一般化できるか」という視点です。</p>



<p>すなわち、開発に使わなかった別のデータにおいても、モデルが同じように予測能を発揮できるかどうかを問います。</p>



<p>例えば、ある大学病院で作られた心血管リスク予測モデルが、地域のクリニックや他国の医療機関でも同様に機能するのか。あるいは、特定の年齢層で開発したモデルが、別の年齢層や背景を持つ患者集団でも通用するのか。</p>



<p>これらを確認するのが外的妥当性です。</p>



<p>外的妥当性を評価するには、以下の方法がよく用いられます。</p>



<ol class="wp-block-list has-swl-main-thin-background-color has-background">
<li><span style="text-decoration: underline;">独立データセットによる検証</span>
<ul class="wp-block-list">
<li>開発データとは異なる施設・地域・時期に収集されたデータを用いる。</li>



<li>最も信頼性の高い外的妥当性評価。</li>
</ul>
</li>



<li><span style="text-decoration: underline;">地理的・時間的外部検証</span>
<ul class="wp-block-list">
<li>地理的：別施設・別地域でのデータを用いる。</li>



<li>時間的：開発時期とは異なる期間のデータを用いる。</li>
</ul>
</li>



<li><span style="text-decoration: underline;">サブグループ検証</span>
<ul class="wp-block-list">
<li>年齢・性別・疾患背景など異なる患者層で予測能を確認する。</li>
</ul>
</li>
</ol>



<p>外的妥当性を検証することにより、モデルの一般化可能性が担保され、臨床現場や他の研究環境での利用が正当化されます。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading">予測モデルの妥当性評価のための評価指標</h3>



<p>予測モデルの妥当性を評価する際には、複数の指標を組み合わせて解釈することが重要です。</p>



<ul class="wp-block-list has-swl-main-thin-background-color has-background">
<li>識別能（discrimination）
<ul class="wp-block-list">
<li>モデルがイベント発生群と非発生群を区別できる力。</li>



<li>代表指標：AUC（C統計量）、Harrell’s C-index。</li>
</ul>
</li>



<li>適合度（calibration）
<ul class="wp-block-list">
<li>予測された確率と実際の発生率がどの程度一致しているか。</li>



<li>Calibration plotなどで評価。</li>
</ul>
</li>



<li>臨床的有用性
<ul class="wp-block-list">
<li>モデルを使うことで臨床意思決定が改善するかどうか。</li>



<li>Decision curve analysis（DCA）などを利用。</li>
</ul>
</li>
</ul>



<p>内的妥当性・外的妥当性のいずれの検証でも、これらの指標を組み合わせて解釈することが求められます。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading">内的妥当性と外的妥当性にはトレードオフの視点が必要</h3>



<p>予測モデル研究には、「内的妥当性を追求しすぎると外的妥当性が損なわれる」というトレードオフがあります。</p>



<p>開発データに過度に適合させると、外部データでの性能が落ちる＝オーバーフィッティングの状態になります。</p>



<p>逆に、外的妥当性を重視しすぎるとモデルが単純化され、開発集団での予測能が十分に得られない場合もあります。</p>



<p>したがって、研究者は「開発データでの適合」と「外部データへの一般化」のバランスを意識し、モデル構築から検証まで一貫した戦略を取ることが求められます。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">IECV（内部–外部クロスバリデーション）とは？</h2>



<p>予測モデル研究では、外的妥当性（generalizability） を示すことが必須です。</p>



<p>しかし、多施設データをまとめて「7:3にランダム分割」しても、開発と検証は同じ集団からのデータであり、真の外的妥当性とは言いにくいです。</p>



<p>そこで<a href="https://www.tripod-statement.org/wp-content/uploads/2020/03/TRIPOD_CLUSTER-EE.pdf" data-type="link" data-id="https://www.tripod-statement.org/wp-content/uploads/2020/03/TRIPOD_CLUSTER.pdf">TRIPOD-Cluster</a>が推奨するのが 内部–外部クロスバリデーション（IECV） という方法。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading">IECVの方法（例：施設ABCDE）</h3>



<ol class="wp-block-list has-swl-main-thin-background-color has-background">
<li>施設ごとに外部検証データを設定
<ul class="wp-block-list">
<li>Aを検証用に外し、B＋C＋D＋Eでモデルを開発 → Aで検証</li>



<li>Bを検証用に外し、A＋C＋D＋Eでモデルを開発 → Bで検証</li>



<li>…以下、すべての施設について繰り返す</li>
</ul>
</li>



<li>施設ごとに外的妥当性を評価
<ul class="wp-block-list">
<li>各施設で、C統計量（AUC）、Calibration slope、Brierスコアなどを算出</li>



<li>「施設Aでは良好だが、施設Bでは性能が低下」など、施設間の差を明らかにする</li>
</ul>
</li>



<li>結果を統合
<ul class="wp-block-list">
<li>全施設の評価指標を統合し、平均的な外的妥当性を算出</li>
</ul>
</li>
</ol>



<p>施設間のばらつき（異質性）も評価可能（ランダム効果メタ解析のイメージ）です。</p>



<figure class="wp-block-image size-large is-resized"><img decoding="async" width="744" height="1024" src="https://best-biostatistics.com/wp/wp-content/uploads/2025/09/ScreenShot-2025-09-09-9.05.53-744x1024.png" alt="" class="wp-image-8584" style="width:400px" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2025/09/ScreenShot-2025-09-09-9.05.53-744x1024.png 744w, https://best-biostatistics.com/wp/wp-content/uploads/2025/09/ScreenShot-2025-09-09-9.05.53-218x300.png 218w, https://best-biostatistics.com/wp/wp-content/uploads/2025/09/ScreenShot-2025-09-09-9.05.53-768x1057.png 768w, https://best-biostatistics.com/wp/wp-content/uploads/2025/09/ScreenShot-2025-09-09-9.05.53.png 856w" sizes="(max-width: 744px) 100vw, 744px" /></figure>



<p class="has-text-align-right">画像引用：<a href="https://www.tripod-statement.org/wp-content/uploads/2020/03/TRIPOD_CLUSTER-EE.pdf">Thomas P A Debray et al., 2022</a></p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading">TRIPOD-Clusterでの位置づけとIECVのメリット</h3>



<p>TRIPOD-Clusterは、IECVを「クラスター化データにおける外的妥当性評価の基本手法」と位置づけています。<br>特に多施設共同研究では、IECVを行うことで、</p>



<ul class="wp-block-list has-swl-main-thin-background-color has-background">
<li>モデルの 一般化可能性</li>



<li>施設間の予測性能のばらつき</li>
</ul>



<p>の両方を示すことが可能になります。</p>



<p>これにより、下記のメリットが期待できます。</p>



<ul class="wp-block-list has-swl-main-thin-background-color has-background">
<li>真の外的妥当性を評価できる
<ul class="wp-block-list">
<li>施設を完全に独立データとして扱うため、「新しい集団でも通用するか」を直接検証できる。</li>
</ul>
</li>



<li>施設間の異質性を明示できる
<ul class="wp-block-list">
<li>「このモデルは都市部の病院では有効だが、地方病院では性能が低い」といった特徴を把握できる。</li>
</ul>
</li>



<li>データを無駄にしない
<ul class="wp-block-list">
<li>7:3分割のように開発データを削らず、全データを活用できる</li>
</ul>
</li>
</ul>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">そもそも妥当性とは？妥当性と信頼性の違い</h2>



<p>予測研究を理解するうえで混同されがちな概念に、「妥当性（validity）」と「信頼性（reliability）」があります。</p>



<p>どちらも研究の質を語る際に頻繁に登場しますが、意味するところは大きく異なります。</p>



<p>ここでは特に多変量解析による予測モデルを念頭に、その違いを整理していきます。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading">妥当性とは何か？</h3>



<p>妥当性とは、予測モデルが「本当に測りたいものを測れているか」「研究の目的に沿った正しい推定ができているか」を指します。つまり「正確さ」に関わる概念です。</p>



<p>予測モデルにおける妥当性を考えるとき、先に説明した内的妥当性と外的妥当性に分けて考えるとわかりやすいでしょう。</p>



<ul class="wp-block-list has-swl-main-thin-background-color has-background">
<li>内的妥当性：モデルが開発集団の中でどの程度うまく予測できているか</li>



<li>外的妥当性：そのモデルが別の集団や環境でも予測性能を維持できるか</li>
</ul>



<p>妥当性が高いとは、「モデルが本来の目的に即して適切に機能している」ということです。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading">信頼性とは何か？</h3>



<p>一方、信頼性は「測定や予測の一貫性」を指します。つまり、同じ条件で繰り返し評価したときに同様の結果が得られるかどうか、という安定性の問題です。</p>



<p>例えば、同じ患者集団で同じ予測モデルを複数回適用したとき、予測確率や判別性能が大きく変動しないのであれば、そのモデルには高い信頼性があるといえます。</p>



<p>逆に、データの取り扱いが少し変わるだけで結果が大きく揺らぐ場合は、信頼性が低いと評価されます。</p>



<p>信頼性は「正しさ（validity）」とは別物であり、たとえ一貫性が高くても間違った方向に安定していることもあります。</p>



<p>その場合は「信頼性は高いが妥当性が低い」という状態になります。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading">妥当性と信頼性の違いを例で考える</h3>



<figure class="wp-block-image size-large is-resized"><img decoding="async" width="1024" height="834" src="https://best-biostatistics.com/wp/wp-content/uploads/2025/09/ScreenShot-2025-09-09-9.20.36-1024x834.png" alt="" class="wp-image-8586" style="width:600px" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2025/09/ScreenShot-2025-09-09-9.20.36-1024x834.png 1024w, https://best-biostatistics.com/wp/wp-content/uploads/2025/09/ScreenShot-2025-09-09-9.20.36-300x244.png 300w, https://best-biostatistics.com/wp/wp-content/uploads/2025/09/ScreenShot-2025-09-09-9.20.36-768x626.png 768w, https://best-biostatistics.com/wp/wp-content/uploads/2025/09/ScreenShot-2025-09-09-9.20.36.png 1424w" sizes="(max-width: 1024px) 100vw, 1024px" /></figure>



<p>よく使われる比喩に「的当て」のイメージがあります。</p>



<ul class="wp-block-list has-swl-main-thin-background-color has-background">
<li>的の中心を「真の値」とすると、妥当性は矢が中心に近いかどうか（正確さ）</li>



<li>信頼性は矢が同じ場所にまとまって刺さっているかどうか（一貫性）</li>
</ul>



<p>つまり、矢がすべて中心から外れた同じ位置に集まっている場合は「信頼性は高いが妥当性が低い」。</p>



<p>逆に、矢が中心の周囲にまばらに散らばっている場合は「妥当性はまずまずだが信頼性が低い」ということになります。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading">予測研究における妥当性と信頼性</h3>



<p>予測研究では、妥当性と信頼性の両立が求められます。例えばロジスティック回帰で構築した予測モデルが、同じ患者集団で繰り返し使っても似た結果を返すのであれば「信頼性が高い」と言えます。</p>



<p>しかし、それが本当に疾患リスクを正しく反映しているか（妥当性）は別問題です。</p>



<p>特に予測モデルの一般化可能性を議論する際には、外的妥当性の観点が欠かせません。</p>



<p>開発集団における信頼性や内的妥当性だけを確認しても、それが異なる患者群で通用するとは限らないからです。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading">外的妥当性とオーバーフィッティングの関係</h3>



<p>ここで重要なのが、外的妥当性の評価はオーバーフィッティングを見抜く役割も果たすという点です。</p>



<p>予測モデルは、開発データに適合させすぎると一見高い精度を示しますが、未知のデータでは急激に性能が低下します。</p>



<p>これは「内的妥当性は高く見えるが外的妥当性が低い」典型的なケースであり、まさにオーバーフィッティングの問題です。</p>



<p>外的妥当性の検証を行うことで、開発時には見えなかった過剰適合が明らかになり、モデルの改良や変数選択の見直しを促すことができます。</p>



<p>したがって外的妥当性の検証は「一般化可能性の確認」という本来の目的に加え、「過剰適合を検出・改善するプロセス」としても重要なのです。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">研究の一般化可能性とは</h2>



<p>予測研究において重要な問いのひとつは、「このモデルは他の集団や環境でも使えるのか？」という点です。</p>



<p>この問いに答える概念が研究の一般化可能性（generalizability）です。</p>



<p>一般化可能性は、しばしば外的妥当性とほぼ同義で使われることもありますが、厳密には「研究結果や予測モデルを、開発に使われなかった別の対象に適用できる程度」を指します。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading">一般化可能性の基本的な考え方</h3>



<p>研究の一般化可能性とは、「研究で得られた知見やモデルが、研究集団を越えて別の対象集団にも通用するか」という問いへの答えです。</p>



<p>臨床研究では「この治療効果は他の病院や他の患者にも当てはまるのか？」、予測研究では「このモデルは異なる患者群でも精度を保てるのか？」というかたちで議論されます。</p>



<p>たとえば、ある病院で構築された心血管リスク予測モデルがあるとします。開発対象は50〜60歳の男性患者でした。</p>



<p>このモデルが70代女性の患者や、別の地域の医療機関の患者にも適用可能かどうかが「一般化可能性」です。</p>



<p>もしその集団で予測能が著しく低下するなら、そのモデルの一般化可能性は乏しいことになります。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading">一般化可能性と外的妥当性</h3>



<p>一般化可能性は外的妥当性と深く関わっています。外的妥当性が高ければ、そのモデルは多様な集団で安定した予測性能を発揮できるため、一般化可能性が高いといえます。</p>



<p>外的妥当性の検証にはいくつかの方法があります。</p>



<ul class="wp-block-list has-swl-main-thin-background-color has-background">
<li>地理的外的妥当性：別の施設や地域のデータで検証する</li>



<li>時間的外的妥当性：異なる時期に収集したデータで検証する</li>



<li>集団外的妥当性：異なる背景（年齢層、性別、疾患背景）を持つ集団で検証する</li>
</ul>



<p>これらの検証を通じて、研究の一般化可能性を評価することができます。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading">一般化可能性を損なう要因</h3>



<p>予測研究における一般化可能性を低下させる主な要因は以下の通りです。</p>



<ol class="wp-block-list has-swl-main-thin-background-color has-background">
<li>対象集団の限定性<br>研究対象が特定の年齢層・性別・疾患群に偏っている場合、他の集団では当てはまらない可能性が高い。</li>



<li>研究環境の特殊性<br>特定の医療機関の診療体制や検査方法が前提となっていると、別の環境では結果が再現できない。</li>



<li>過剰適合（オーバーフィッティング）<br>開発データに過度に適合したモデルは、未知のデータでは性能を維持できず、一般化可能性を著しく損なう。</li>
</ol>



<p>このうち過剰適合は、予測研究における最も典型的な問題といえます。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading">一般化可能性とオーバーフィッティング</h3>



<p>過剰適合は「開発データにおいては高精度を示すが、新しいデータでは精度が低下する」現象です。これはまさに「一般化できない」状態です。</p>



<p>予測モデル研究における外的妥当性の検証は、過剰適合を見抜くうえで不可欠です。</p>



<p>もし独立した検証データで性能が著しく落ちるなら、そのモデルは一般化可能性を持たないと判断できます。</p>



<p>逆に、外部データでも安定した予測性能を維持できるなら、そのモデルは高い一般化可能性を有することになります。</p>



<p>したがって、一般化可能性の議論は単なる理論的な話ではなく、オーバーフィッティングの問題と実務的に直結しています。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading">一般化可能性を高める工夫</h3>



<p>研究の設計段階から一般化可能性を意識することが重要です。具体的な工夫としては、</p>



<ul class="wp-block-list has-swl-main-thin-background-color has-background">
<li>多施設共同研究でモデルを開発する（特定施設のバイアスを避ける）</li>



<li>対象者の選定を広くする（年齢層や背景を限定しすぎない）</li>



<li>外部検証を前提とした研究計画を立てる</li>



<li>シンプルなモデルを選択する（複雑すぎるモデルは過剰適合しやすい）</li>
</ul>



<p>これらの取り組みによって、研究結果の一般化可能性を高めることができます。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">まとめ</h2>



<p>予測研究においては、単に多変量解析でモデルを構築するだけでは十分ではありません。</p>



<p>そのモデルが「正しく作られているか」「新しい集団でも使えるか」を検証することが不可欠です。</p>



<p>そのために重要なのが、内的妥当性と外的妥当性という二つの視点です。</p>



<ul class="wp-block-list has-swl-main-thin-background-color has-background">
<li>内的妥当性：開発集団で正しく機能しているか</li>



<li>外的妥当性：別集団や環境でも使えるか</li>



<li>信頼性：繰り返し評価しても結果が安定しているか</li>



<li>一般化可能性：研究成果が現実の臨床や他の場面でも再現できるか</li>



<li>過剰適合：これらを損なう最大のリスク要因</li>
</ul>



<p>これらの視点をバランスよく取り入れることが、予測研究の成功を左右します。</p>



<p>臨床や実務で「本当に役立つモデル」を作るためには、内的妥当性と外的妥当性を両輪として検証し、過剰適合を避けつつ一般化可能性を高めていきましょう。<br></p>



<p>こちらの内容はYoutubeでも解説しております。</p>



<p>よろしければこちらの動画をご覧くださいませ。</p>



<figure class="wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio"><div class="wp-block-embed__wrapper">
<iframe title="これを知らないと予測研究は失敗する！？予測研究で失敗する人が見落とす「内的妥当性」と「外的妥当性」" width="500" height="281" src="https://www.youtube.com/embed/lu0H8qygfs0?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>
</div></figure>
]]></content:encoded>
					
					<wfw:commentRss>https://best-biostatistics.com/summary/validation.html/feed</wfw:commentRss>
			<slash:comments>0</slash:comments>
		
		
			</item>
		<item>
		<title>確率密度関数とは？わかりやすく正規分布一様分布の面積が確率になる意味と求め方</title>
		<link>https://best-biostatistics.com/summary/prob-density.html</link>
					<comments>https://best-biostatistics.com/summary/prob-density.html#comments</comments>
		
		<dc:creator><![CDATA[beat1115]]></dc:creator>
		<pubDate>Tue, 05 Aug 2025 23:00:39 +0000</pubDate>
				<category><![CDATA[データを解析しよう]]></category>
		<category><![CDATA[統計]]></category>
		<category><![CDATA[統計学]]></category>
		<guid isPermaLink="false">https://best-biostatistics.com/?p=2353</guid>

					<description><![CDATA[<p><img src="https://best-biostatistics.com/wp/wp-content/uploads/2021/12/統計のYoutubeアイキャッチ-27-1024x576.jpg" class="webfeedsFeaturedVisual" /></p>統計学では、確率密度や確率密度関数といった語句がよく出てきます。 これらの言葉は、”確率”としばしば混同されて使われていますが、確率と確率密度は大きく異なります。 では、確率と、確率密度や確率密度関数は何が違うのでしょう [&#8230;]]]></description>
										<content:encoded><![CDATA[<p><img src="https://best-biostatistics.com/wp/wp-content/uploads/2021/12/統計のYoutubeアイキャッチ-27-1024x576.jpg" class="webfeedsFeaturedVisual" /></p>
<p>統計学では、確率密度や確率密度関数といった語句がよく出てきます。</p>



<p>これらの言葉は、”確率”としばしば混同されて使われていますが、<strong><span class="marker">確率と確率密度は大きく異なります</span></strong>。</p>



<p>では、確率と、確率密度や確率密度関数は何が違うのでしょうか。</p>



<p>この記事では、統計学での重要単語&#8221;確率密度と確率密度関数&#8221;についてわかりやすく出てきます。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">確率密度関数とは？理解するのに重要な確率変数</h2>


<div class="wp-block-image">
<figure class="aligncenter"><img decoding="async" width="640" height="323" src="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/7f418be16ff229275d0670150ea529e0_s-e1577088780405.jpg" alt="" class="wp-image-2528" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/7f418be16ff229275d0670150ea529e0_s-e1577088780405.jpg 640w, https://best-biostatistics.com/wp/wp-content/uploads/2019/10/7f418be16ff229275d0670150ea529e0_s-e1577088780405-300x151.jpg 300w" sizes="(max-width: 640px) 100vw, 640px" /></figure>
</div>


<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>確率密度の話をするには、はじめに確率変数の話をする必要があります。</p>



<p><strong><span class="marker">確率変数は、&#8221;ある変数の値をとる確率が存在する変数&#8221;</span></strong>です。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>例えば、サイコロを例にして考えてみましょう。</p>



<p>サイコロは1、２、３、４、５、６と6つの目があります。</p>



<p>サイコロの各目が出る確率は1/6ですから、それぞれのサイコロの目は確率変数です。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>身長の例を考えてみましょう。</p>



<p>身長のデータが得られて、<a href="https://best-biostatistics.com/summary/hist.html" data-type="post" data-id="463">ヒストグラム</a>を作成してみると、下記のようになります。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<figure class="wp-block-image"><img decoding="async" width="805" height="412" src="https://best-biostatistics.com/wp/wp-content/uploads/2018/10/screenshot-2019-06-09-16.56.53.png" alt="" class="wp-image-1515" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2018/10/screenshot-2019-06-09-16.56.53.png 805w, https://best-biostatistics.com/wp/wp-content/uploads/2018/10/screenshot-2019-06-09-16.56.53-300x154.png 300w, https://best-biostatistics.com/wp/wp-content/uploads/2018/10/screenshot-2019-06-09-16.56.53-768x393.png 768w" sizes="(max-width: 805px) 100vw, 805px" /></figure>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>そして、上記のヒストグラムを滑らかにしてみると、下記のようなグラフになります。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<figure class="wp-block-image"><img decoding="async" width="812" height="472" src="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/正規分布_０-1.png" alt="" class="wp-image-1815" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/正規分布_０-1.png 812w, https://best-biostatistics.com/wp/wp-content/uploads/2019/10/正規分布_０-1-300x174.png 300w, https://best-biostatistics.com/wp/wp-content/uploads/2019/10/正規分布_０-1-768x446.png 768w" sizes="(max-width: 812px) 100vw, 812px" /></figure>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>確率変数は、上の2つ図では横軸にあたります。</p>



<p>この確率変数は、確率変数の性質によって、</p>



<ul class="wp-block-list">
<li><strong>離散確率変数</strong></li>



<li><strong>連続確率変数</strong></li>
</ul>



<p>2種類に分けることができます。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>離散変数は上のヒストグラムやサイコロの目のように、変数が飛び飛びで存在しているものを指します。</p>



<p>&gt;&gt;&gt;<a href="https://best-biostatistics.com/summary/hist.html">ヒストグラムとは？エクセルでの作成方法と解釈を簡単にわかりやすく</a></p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>サイコロの目は1から６と連続のように思えますが、これは飛び飛び、つまり離散的です。</p>



<p>連続な値は1、1.0000001、1.001111といったように、シームレスに繋がった値のことです。</p>



<p>1、1.1、1.2のような小数刻みでも離散的な値になります。</p>



<p>＞＞<a href="https://best-biostatistics.com/biostat/data.html" target="_blank" rel="noopener noreferrer">データの種類に応じて解析方法は決まる</a></p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading">確率変数が離散的な場合、各変数が生じる可能性が”確率”</h3>



<p><strong><span class="marker">離散的な変数の時とき、各変数が生じる可能性を&#8221;確率&#8221;と言います。</span></strong></p>



<p>これは中学や高校などでも習う概念で、サイコロの目や、コインの表と裏のような話です。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>ここではサイコロを例に考えてみます。</p>



<p>サイコロで1が出る確率は1/6です。</p>



<p>つまり各目が出る確率は1/6で、確率変数が6個あるので、</p>



<p>サイコロを振ってどれかの目が出る確率は1/6 x 6 = 1となります。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading">確率変数が連続変数の場合は？</h3>



<p>次に、連続確率変数を考えます。</p>



<p>連続確率変数は上の２つ目の図のように、変数が連続的なものを指します。</p>



<p>例えば、1から6までの連続確率変数があったときに生じうる変数は、1.1や1.1111、1.010101といった様々な変数をとることができます。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>もし、サイコロの時のように1から6までの値が生じる可能性が1/6の一様だったとしましょう。</p>



<p>このとき、どれかの値が出る可能性はどうなるでしょうか。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>離散変数と同じように、確率で考えた場合。</p>



<p>1/6 X 無限　= 無限</p>



<p>と可能性が1ではなくなってしまいます。</p>



<p>これはおかしいですよね。</p>



<p>つまり、連続変数の場合では、従来の確率の概念を使うことができなくなってしまいます。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">確率密度とは？一様分布の例で面積との関係や求め方をわかりやすく！</h2>


<div class="wp-block-image">
<figure class="aligncenter"><img decoding="async" width="640" height="350" src="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/f3ff2b38f21bcd8da977db80ed2a0e7e_s-e1577089044626.jpg" alt="" class="wp-image-2531" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/f3ff2b38f21bcd8da977db80ed2a0e7e_s-e1577089044626.jpg 640w, https://best-biostatistics.com/wp/wp-content/uploads/2019/10/f3ff2b38f21bcd8da977db80ed2a0e7e_s-e1577089044626-300x164.jpg 300w" sizes="(max-width: 640px) 100vw, 640px" /></figure>
</div>


<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>先ほど、<strong><span class="marker">連続確率変数では、確率の概念を用いるとおかしくなる</span></strong>ということを見ました。</p>



<p>そこで、用いる概念を確率密度と呼びます。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>先ほどの例を考えますと、1から6までの連続確率変数で、全ての値が一様な可能性で出るとします。</p>



<p>このような時は、1から6までの値の合計、つまり、何かの値が出る確率が1になるように定義します。</p>



<p>イメージは下の図ですね。</p>



<figure class="wp-block-image"><img decoding="async" width="441" height="188" src="https://best-biostatistics.com/wp/wp-content/uploads/2019/11/スクリーンショット-2019-11-26-22.24.14.png" alt="" class="wp-image-2425" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2019/11/スクリーンショット-2019-11-26-22.24.14.png 441w, https://best-biostatistics.com/wp/wp-content/uploads/2019/11/スクリーンショット-2019-11-26-22.24.14-300x128.png 300w" sizes="(max-width: 441px) 100vw, 441px" /></figure>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>このイメージで<span style="color: #ff0000;"><strong>高さに対応するものが、確率密度</strong></span>になります。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<figure class="wp-block-image"><img decoding="async" width="476" height="218" src="https://best-biostatistics.com/wp/wp-content/uploads/2019/11/スクリーンショット-2019-11-26-22.24.20.png" alt="" class="wp-image-2426" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2019/11/スクリーンショット-2019-11-26-22.24.20.png 476w, https://best-biostatistics.com/wp/wp-content/uploads/2019/11/スクリーンショット-2019-11-26-22.24.20-300x137.png 300w" sizes="(max-width: 476px) 100vw, 476px" /></figure>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>横の幅は6 − 1 = 5で、5ですので、確率密度は1/5となります。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>では、ここで問題です。</p>



<p>上の例で2が出る&#8221;確率&#8221;はいくらでしょうか。</p>



<p>答えはほぼゼロです。</p>



<p>理由は、1/無限　= ほぼゼロだからです。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>では2ぐらいの値（1.5から2.5まで）が出る確率はいくらでしょうか?</p>



<p>答えは1/5です。</p>



<p>この理由は、1/5x (2.5 −1.5) = 1/5 だからです。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading">連続変数では、高さが確率密度で面積が確率</h3>



<p>このように、<span style="color: #ff0000;"><strong>連続変数では確率は面積に対応します</strong></span>。</p>



<p><strong><span class="marker">確率密度は上記の図で言うと、面積の高さに相当します。</span></strong></p>



<p><strong><span class="marker">高さである確率密度に、横幅である確率変数の範囲をかけて面積を求めることでようやく確率になります。</span></strong></p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>確率変数の幅というのは、以前に正規分布のところで出てきました。</p>



<figure class="wp-block-image"><img decoding="async" width="810" height="529" src="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/標準偏差.png" alt="" class="wp-image-1822" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/標準偏差.png 810w, https://best-biostatistics.com/wp/wp-content/uploads/2019/10/標準偏差-300x196.png 300w, https://best-biostatistics.com/wp/wp-content/uploads/2019/10/標準偏差-768x502.png 768w" sizes="(max-width: 810px) 100vw, 810px" /></figure>



<figure class="wp-block-image"><img decoding="async" width="956" height="579" src="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/標準正規分布_概念_完成.png" alt="" class="wp-image-1855" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/標準正規分布_概念_完成.png 956w, https://best-biostatistics.com/wp/wp-content/uploads/2019/10/標準正規分布_概念_完成-300x182.png 300w, https://best-biostatistics.com/wp/wp-content/uploads/2019/10/標準正規分布_概念_完成-768x465.png 768w" sizes="(max-width: 956px) 100vw, 956px" /></figure>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>これですね。</p>



<p>ある範囲に値が含まれている可能性という考え方は、統計学では広く用いられており、</p>



<p>それに伴い、確率密度の概念も広く用いられています。</p>



<p>&gt;&gt;&gt;<a href="https://best-biostatistics.com/summary/normal_dist.html">正規分布とは？簡単にわかりやすく標準偏差との関係やエクセルでのグラフ化を解説</a></p>



<p>&gt;&gt;&gt;<a href="https://best-biostatistics.com/summary/standard-norm.html">標準正規分布表の見方について！標準化やZ値の計算式はどうすればいい？</a></p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">確率密度関数とは？正規分布の場合を例にわかりやすく</h2>



<p>確率密度関数は確率密度と確率変数の関係を表した関数のことを表しています。</p>



<p>代表的な確率密度関数といえば、</p>



<p>正規分布の関数がそれにあたります。</p>



<figure class="wp-block-image"><img decoding="async" width="1114" height="129" src="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/正規分布.png" alt="" class="wp-image-1831" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/正規分布.png 1114w, https://best-biostatistics.com/wp/wp-content/uploads/2019/10/正規分布-300x35.png 300w, https://best-biostatistics.com/wp/wp-content/uploads/2019/10/正規分布-768x89.png 768w, https://best-biostatistics.com/wp/wp-content/uploads/2019/10/正規分布-1024x119.png 1024w" sizes="(max-width: 1114px) 100vw, 1114px" /></figure>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>これですね。</p>



<p>&gt;&gt;&gt;<a href="https://best-biostatistics.com/summary/normal_dist.html">正規分布とは？簡単にわかりやすく標準偏差との関係やエクセルでのグラフ化を解説</a></p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>ここでは、難しい数式は取り上げませんが、確率と確率密度の関係は一般的には積分の形で表しています。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">確率密度関数に関するまとめ</h2>


<div class="wp-block-image">
<figure class="aligncenter"><img decoding="async" width="640" height="334" src="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/ec17114ba3d7d829dcd97f397b8c1421_s-e1577088691586.jpg" alt="" class="wp-image-2527" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/ec17114ba3d7d829dcd97f397b8c1421_s-e1577088691586.jpg 640w, https://best-biostatistics.com/wp/wp-content/uploads/2019/10/ec17114ba3d7d829dcd97f397b8c1421_s-e1577088691586-300x157.jpg 300w" sizes="(max-width: 640px) 100vw, 640px" /></figure>
</div>


<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>離散確率変数では、ある確率変数が生じる可能性を確率という</p>



<p>連続確率変数では、確率密度という概念を用いる。</p>



<p>連続確率変数では、確率密度と確率変数の幅の積が、確率に相当する。</p>



<p>連続確率変数と確率密度の関係を表したものを確率密度関数という。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>確率密度は少し難しい概念ですが、統計学で非常に重要な概念です。</p>



<p>少しずつ慣れていきましょう!!</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>
]]></content:encoded>
					
					<wfw:commentRss>https://best-biostatistics.com/summary/prob-density.html/feed</wfw:commentRss>
			<slash:comments>1</slash:comments>
		
		
			</item>
		<item>
		<title>不偏分散とは？n-1で割る理由や求め方を簡単にわかりやすく解説！</title>
		<link>https://best-biostatistics.com/summary/fuhen-bunsan-n1.html</link>
					<comments>https://best-biostatistics.com/summary/fuhen-bunsan-n1.html#respond</comments>
		
		<dc:creator><![CDATA[beat1115]]></dc:creator>
		<pubDate>Fri, 01 Aug 2025 04:00:42 +0000</pubDate>
				<category><![CDATA[データを解析しよう]]></category>
		<category><![CDATA[Summary]]></category>
		<category><![CDATA[標準偏差]]></category>
		<guid isPermaLink="false">https://best-biostatistics.com/?p=1883</guid>

					<description><![CDATA[<p><img src="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/screenshot-2019-10-11-11.09.59.png" class="webfeedsFeaturedVisual" /></p>統計での分散には、&#8221;nで割る分散&#8221;と&#8221;n-1で割る分散&#8221;の二種類があります。 &#8220;nで割る分散&#8221;は、一般的な分散です。 &#8220;n-1で割る分散 [&#8230;]]]></description>
										<content:encoded><![CDATA[<p><img src="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/screenshot-2019-10-11-11.09.59.png" class="webfeedsFeaturedVisual" /></p>
<p>統計での分散には、&#8221;nで割る分散&#8221;と&#8221;n-1で割る分散&#8221;の二種類があります。</p>



<p>&#8220;nで割る分散&#8221;は、一般的な分散です。</p>



<p>&#8220;n-1で割る分散&#8221;を不偏分散と呼びます。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>この記事では、</p>



<ul class="wp-block-list">
<li><strong>一般的な分散と不偏分散では何が違うのか。</strong></li>



<li><strong>どうして、不偏分散はn-1で割る必要があるのか。</strong></li>



<li><strong>分散と不偏分散の使い分け方</strong></li>
</ul>



<p>ついて説明していきます。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">不偏分散と標本分散の違いは？n-1で割る理由</h2>


<div class="wp-block-image">
<figure class="aligncenter"><img decoding="async" width="640" height="345" src="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/987eca87017b5f2fa265f89558d4724a_s-e1577496841202.jpg" alt="" class="wp-image-2530" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/987eca87017b5f2fa265f89558d4724a_s-e1577496841202.jpg 640w, https://best-biostatistics.com/wp/wp-content/uploads/2019/10/987eca87017b5f2fa265f89558d4724a_s-e1577496841202-300x162.jpg 300w" sizes="(max-width: 640px) 100vw, 640px" /></figure>
</div>


<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>まずは、標本分散と普遍分散の違いについて。</p>



<ul class="wp-block-list">
<li><strong>標本分散：データのバラツキを表すために用いられる</strong></li>



<li><strong><span style="color: #333333;">不偏分散：標本から母集団の分散を推定するために用いられる</span></strong></li>
</ul>



<p>そして分散には母分散と標本分散があります。</p>



<p>&#8220;標本分散&#8221;と&#8221;不偏分散&#8221;の違いを理解するためには、まず、母集団と標本の性質について知る必要があります。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading">不偏分散を理解するのに必要な母集団と標本とは？</h3>



<p>母集団と標本の意味は以下のようです。</p>



<ul class="wp-block-list">
<li>母集団は<strong>&#8220;知りたい対象のすべて&#8221;</strong>を指します。</li>



<li><span style="font-size: 1em; letter-spacing: 0.05em;">標本は<strong>&#8220;知りたい対象の一部&#8221;</strong>を指します。</span></li>
</ul>



<p>母集団と標本の関係性は意味は以下のようです。</p>



<ul class="wp-block-list">
<li><strong>&#8220;知りたい対象のすべて&#8221;を調べるために、<span style="font-size: 1em; letter-spacing: 0.05em;">&#8220;知りたい対象の一部&#8221;を調べることを&#8221;<span style="color: #ff0000;">抽出</span>&#8220;と言います。</span></strong></li>



<li><strong><span style="font-size: 1em; letter-spacing: 0.05em;">&#8220;知りたい対象の一部&#8221;から&#8221;知りたい対象のすべて&#8221;を予測することを&#8221;<span style="color: #ff0000;">推定</span>&#8220;と言います。</span></strong></li>
</ul>


<div class="wp-block-image">
<figure class="aligncenter"><img decoding="async" width="652" height="362" src="https://best-biostatistics.com/wp/wp-content/uploads/2013/05/スクリーンショット-2019-05-06-22.50.33.png" alt="" class="wp-image-1377" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2013/05/スクリーンショット-2019-05-06-22.50.33.png 652w, https://best-biostatistics.com/wp/wp-content/uploads/2013/05/スクリーンショット-2019-05-06-22.50.33-300x167.png 300w, https://best-biostatistics.com/wp/wp-content/uploads/2013/05/スクリーンショット-2019-05-06-22.50.33-375x208.png 375w" sizes="(max-width: 652px) 100vw, 652px" /></figure>
</div>


<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>詳しくは、<a href="https://best-biostatistics.com/biostat/boshuudan.html">母集団と標本の関係とは</a>でも説明しています！</p>



<p>&#8220;標本分散&#8221;と&#8221;不偏分散&#8221;が使われるのは、母集団から抽出した標本の性質に由来します。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading">不偏分散がn-1で割る分散</h3>



<p>母集団と標本の関係には</p>



<p><span style="color: #ff0000;"><strong>&#8220;母集団の性質と、母集団から抽出した標本の性質は一緒ではない&#8221;</strong></span>という性質があります。</p>



<p>母集団の、平均、分散、標準偏差と、</p>



<p>標本の、平均、分散、標準偏差は、</p>



<p>一致するとは限りません（偶然一致することはあります）。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>そのため、<strong><span style="color: #ff0000;">統計学では母集団と標本の統計の値は区別して考えられています</span></strong>。</p>



<p><span style="color: #333333;">統計学では母集団と標本の統計の値は区別して考えるため、</span></p>



<p>母集団の分散を<strong><span style="font-size: 20px;">母分散</span></strong>、</p>



<p><span class="marker">標本の分散を<strong><span style="font-size: 20px;">標本分散</span></strong>と呼びます。</span></p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>標本分散は、式ではこのように書きます。</p>


<div class="wp-block-image">
<figure class="aligncenter"><img decoding="async" width="1243" height="81" src="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/分散_式.png" alt="" class="wp-image-1819" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/分散_式.png 1243w, https://best-biostatistics.com/wp/wp-content/uploads/2019/10/分散_式-300x20.png 300w, https://best-biostatistics.com/wp/wp-content/uploads/2019/10/分散_式-768x50.png 768w, https://best-biostatistics.com/wp/wp-content/uploads/2019/10/分散_式-1024x67.png 1024w" sizes="(max-width: 1243px) 100vw, 1243px" /></figure>
</div>


<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>多くの調査や研究は、<span style="color: #333333;">母集団の性質を明らかにするが目的</span>で行われています。</p>



<p>しかし、<strong><span class="marker">母集団を調査することは、コストや技術的に不可能なことが多いです。</span></strong></p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>そこで、<strong><span style="color: #ff0000;">標本から母集団を推定する</span></strong>必要が生まれます。</p>



<p><span style="color: #333333;"><span class="marker">標本から母集団の分散を推定する</span><span class="marker">ために、<strong><span style="font-size: 20px;">不偏分散</span></strong>が用いられます。</span></span></p>



<p>不偏分散は、式ではこのように書きます。</p>


<div class="wp-block-image">
<figure class="aligncenter"><img decoding="async" width="1329" height="81" src="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/不偏分散_式.png" alt="" class="wp-image-1887" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/不偏分散_式.png 1329w, https://best-biostatistics.com/wp/wp-content/uploads/2019/10/不偏分散_式-300x18.png 300w, https://best-biostatistics.com/wp/wp-content/uploads/2019/10/不偏分散_式-768x47.png 768w, https://best-biostatistics.com/wp/wp-content/uploads/2019/10/不偏分散_式-1024x62.png 1024w" sizes="(max-width: 1329px) 100vw, 1329px" /></figure>
</div>


<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p><strong><span class="marker">(観測データ-1)と、データ数から1を引くのが標本分散との違いです。</span></strong></p>



<p>これが俗にいうn-1の分散。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>ここまでの話をまとめると、</p>



<ul class="wp-block-list">
<li><strong>母集団の分散を母分散という</strong></li>



<li><strong>標本の分散を標本分散という</strong></li>



<li><strong>標本から母集団の分散を推定した分散を不偏分散という</strong></li>
</ul>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading">不偏分散の名前の由来：分散の不偏推定量だから</h3>



<p>不偏分散という名前は、不偏分散分散の不偏推定量であることに由来します。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>標本から母集団の性質を推定するために、<span style="font-size: 20px;">不偏推定量</span>というものが用いられます。</p>



<p><strong><span class="marker">不偏とは、漢字の通り、&#8221;偏りのないもの&#8221;という意味です。</span></strong></p>



<p>統計学には、<strong>&#8220;平均的に過大にも過少にも推定していない&#8221;という意味</strong>です。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p><span style="color: #ff0000;"><strong>&#8220;母集団の性質と、母集団から抽出した標本の性質は一緒ではない&#8221;</strong></span>という性質により、</p>



<p>標本の性質は、母集団と比べたとき、偏りが生じてしまいます。</p>



<p>この偏りを補正することで、母集団の性質を推定したものを不偏推定量といます。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">どうして、不偏分散はn-1で割るのか？</h2>



<p>不偏分散で、n-1で割るのは&#8221;偏り&#8221;を補正するためです。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p><span style="color: #333333;">先ほど、&#8221;母集団の性質と、母集団から抽出した標本の性質は一緒ではない&#8221;と説明しました。</span></p>



<p>これは、標本の性質は、母集団の性質と比べてからみて&#8221;偏り&#8221;といえます。</p>



<p>不偏分散で、n-1で割るのはこのかたよりを補正するためです。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>具体的には、<span style="color: #ff0000;"><strong>標本分散は母分散よりも小さくなる</strong><span style="color: #333333;">という性質に由来します。</span></span></p>



<p>これを防ぐために、n-1で割ります。</p>



<p>1を引くと分母が小さくなるので、分散は少し大きくなります。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading">不偏分散から不偏標準偏差へ：注意してほしいこと</h3>



<p>不偏〇〇というのは、母集団の性質の不偏推定量と上で説明しました。</p>



<p>そのため、不偏標準偏差を母集団の標準偏差（母標準偏差）として定義します。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>しかし、多くの文献やネットの情報では、</p>



<p><span style="color: #ff0000;"><strong>&#8220;不偏分散の平方根&#8221;を、不偏標準偏差として定義していますが、</strong></span></p>



<p><span style="color: #ff0000;"><strong>これは誤用なので気をつけてください。</strong></span></p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>正しい不偏標準偏差は、<span style="color: #ff0000;"><strong>&#8220;不偏分散の平方根を補正した値&#8221;</strong><span style="color: #333333;">です。</span></span></p>



<p><span style="color: #ff0000;"><strong>&#8220;不偏分散の平方根&#8221;</strong><span style="color: #333333;">は<strong>&#8220;不偏分散の平方根&#8221;や&#8221;不偏分散平方根&#8221;</strong>として定義されています。</span></span></p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>しかし、Excelなどでは、<span style="color: #ff0000;"><span style="color: #333333;"><strong>&#8220;不偏分散平方根&#8221;</strong>の計算が用いられており、</span></span>名称以外はそこまで意識する必要はありません。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">不偏分散と標本分散はどちらを使うべき？</h2>


<div class="wp-block-image">
<figure class="aligncenter"><img decoding="async" width="640" height="344" src="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/04f591349452e915fbed103cd5b59d97_s-e1570759635360.jpg" alt="" class="wp-image-1907" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/04f591349452e915fbed103cd5b59d97_s-e1570759635360.jpg 640w, https://best-biostatistics.com/wp/wp-content/uploads/2019/10/04f591349452e915fbed103cd5b59d97_s-e1570759635360-300x161.jpg 300w" sizes="(max-width: 640px) 100vw, 640px" /></figure>
</div>


<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<ul class="wp-block-list">
<li><strong>データの分散が知りたいとき：分散（標本分散　or 母分散）</strong></li>



<li><strong>データから母集団の性質を推定したいとき：不偏分散</strong></li>
</ul>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>母集団の推定が目的のときは、不偏分散を用います。</p>



<p><strong><span class="marker">クラスのテストの結果など、母集団のデータが揃っている場合は、分散を用います。</span></strong></p>



<p>標準偏差のときは</p>



<ul class="wp-block-list">
<li><strong>データの標準偏差が知りたいとき：標準偏差（標本標準偏差　or 母標準偏差）</strong></li>



<li><strong>データから母集団の性質を推定したいとき：不偏標準偏差　or 不偏分散平方根</strong></li>
</ul>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>標準偏差と分散の関係については、こちらの記事をご覧ください！</p>



<p>＞＞<a href="https://best-biostatistics.com/summary/sd-variance.html" target="_blank" rel="noopener noreferrer">標準偏差と分散の関係は？</a></p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">不偏分散を求めるのにエクセルでの関数は？</h2>



<p>最後に、エクセルで分散または、不偏分散または不偏標準偏差を用いる時に使う関数について紹介します。</p>



<p><strong>分散と不偏分散</strong></p>



<figure class="wp-block-table"><table class="has-fixed-layout"><tbody><tr><td>分散（標本分散　or 母分散）</td><td>VAR.P</td></tr><tr><td>不偏分散</td><td>VAR または　VAR.S</td></tr></tbody></table></figure>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p><strong>標準偏差と不偏標準偏差または不偏分散平方根</strong></p>



<figure class="wp-block-table"><table class="has-fixed-layout"><tbody><tr><td>標準偏差（標本標準偏差　or 母標準偏差）</td><td><a href="https://best-biostatistics.com/excel/sd_excel.html" data-type="post" data-id="483">STDEV.P</a></td></tr><tr><td>不偏標準偏差</td><td>該当なし</td></tr><tr><td>不偏分散の平方根</td><td>STDEV または　<a href="https://best-biostatistics.com/excel/sd_excel.html" data-type="post" data-id="483">STDEV.S</a></td></tr></tbody></table></figure>



<div style="height:19px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">まとめ</h2>



<ul class="wp-block-list">
<li><strong>母集団の分散を母分散という</strong></li>



<li><strong>標本の分散を標本分散という</strong></li>



<li><strong>標本から母集団の分散を推定した分散を不偏分散という</strong></li>



<li><strong>不偏分散で、n-1で割るのは&#8221;偏り&#8221;を補正するため</strong></li>
</ul>



<div style="height:19px" aria-hidden="true" class="wp-block-spacer"></div>



<p>＞＞<a href="https://best-biostatistics.com/summary/sum-stat.html" target="_blank" rel="noopener noreferrer">要約統計量とは？何を出力すればいいの？</a></p>



<p>＞＞<a href="https://best-biostatistics.com/summary/95ci.html" target="_blank" rel="noopener noreferrer">95%信頼区間とは何？1.96の意味とは？</a></p>



<p>＞＞<a href="https://best-biostatistics.com/biostat/boshuudan.html" target="_blank" rel="noopener noreferrer">母集団と標本の違いとは？</a></p>



<p>＞＞<a href="https://best-biostatistics.com/summary/sd-variance.html" target="_blank" rel="noopener noreferrer">標準偏差と分散の関係は？</a></p>
]]></content:encoded>
					
					<wfw:commentRss>https://best-biostatistics.com/summary/fuhen-bunsan-n1.html/feed</wfw:commentRss>
			<slash:comments>0</slash:comments>
		
		
			</item>
		<item>
		<title>標準偏差と分散の関係や違いとは？データの単位と同じ次元はどっち？</title>
		<link>https://best-biostatistics.com/summary/sd-variance.html</link>
					<comments>https://best-biostatistics.com/summary/sd-variance.html#comments</comments>
		
		<dc:creator><![CDATA[beat1115]]></dc:creator>
		<pubDate>Wed, 30 Jul 2025 21:00:15 +0000</pubDate>
				<category><![CDATA[データを解析しよう]]></category>
		<category><![CDATA[Summary]]></category>
		<category><![CDATA[標準偏差]]></category>
		<guid isPermaLink="false">https://best-biostatistics.com/?p=1840</guid>

					<description><![CDATA[<p><img src="https://best-biostatistics.com/wp/wp-content/uploads/2021/12/統計のYoutubeアイキャッチ-21-1024x576.jpg" class="webfeedsFeaturedVisual" /></p>データのバラツキを表すパラメーターである&#8221;標準偏差&#8221;。 しかし標準偏差と同様に、統計では&#8221;分散&#8221;というもう一つのデータのバラツキを表すパラメーターが出てきます。 バラツキを [&#8230;]]]></description>
										<content:encoded><![CDATA[<p><img src="https://best-biostatistics.com/wp/wp-content/uploads/2021/12/統計のYoutubeアイキャッチ-21-1024x576.jpg" class="webfeedsFeaturedVisual" /></p>
<p>データのバラツキを表すパラメーターである&#8221;標準偏差&#8221;。</p>



<p>しかし標準偏差と同様に、統計では&#8221;分散&#8221;というもう一つのデータのバラツキを表すパラメーターが出てきます。</p>



<p>バラツキを表すパラメータとして、分散と標準偏差は何が違うのでしょうか？</p>



<p>この記事では、分散と標準偏差の関係と分散と標準偏差の求め方について説明します。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">分散と標準偏差の関係とは？</h2>


<div class="wp-block-image">
<figure class="aligncenter"><img decoding="async" width="640" height="323" src="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/7f418be16ff229275d0670150ea529e0_s-e1577088780405.jpg" alt="" class="wp-image-2528" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/7f418be16ff229275d0670150ea529e0_s-e1577088780405.jpg 640w, https://best-biostatistics.com/wp/wp-content/uploads/2019/10/7f418be16ff229275d0670150ea529e0_s-e1577088780405-300x151.jpg 300w" sizes="(max-width: 640px) 100vw, 640px" /></figure>
</div>


<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p><strong><span class="marker">標準偏差と分散はどちらもデータのバラツキを表すパラメーター（指標）です</span></strong>。</p>



<p>標準偏差と分散の関係は、次のような関係があります。</p>



<p class="has-text-align-center"><span style="color: #ff0000;"><strong>(標準偏差)<sup>2</sup>=分散</strong></span></p>



<p>そのため、標準偏差と分散の性質は非常によく似ています。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading">標準偏差とは?</h3>



<p>&#8220;標準偏差&#8221;は一言で言うならば、データのバラツキを表すパラメーターです。</p>



<p>そのため、標準偏差には次のような特徴があります。</p>



<ul class="wp-block-list">
<li><strong>標準偏差が小さい　→ 平均に近いデータが多い　→データのバラツキが小さい</strong></li>



<li><strong>標準偏差が大きい　→ 平均から離れたデータが多い　→データのバラツキが大きい</strong></li>
</ul>



<p>詳しくは、<a href="https://best-biostatistics.com/summary/normal_dist.html">正規分布とは？簡単にわかりやすく標準偏差との関係やエクセルでのグラフ化を解説</a>の記事で紹介しています。</p>



<p>次に、分散について説明していきます。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading">分散とは?</h3>



<p>分散も、標準偏差と同様にデータのバラツキを表すパラメータです。</p>



<p>そのため、分散にも標準偏差と同様に次のような特徴があります。</p>



<ul class="wp-block-list">
<li><strong>分散が小さい　→ 平均に近いデータが多い　→データのバラツキが小さい</strong></li>



<li><strong>分散が大きい　→ 平均から離れたデータが多い　→データのバラツキが大きい</strong></li>
</ul>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading">分散と標準偏差の関係</h3>



<p>分散と標準偏差との関係を再度確認してみましょう。</p>



<p>分散と標準偏差には、次のような関係がありましたね。</p>



<p class="has-text-align-center"><strong>(標準偏差)<sup>2</sup>=分散</strong></p>



<p><strong><span class="marker">標準偏差ですが、分散から求めるしか計算方法がありません</span></strong>。</p>



<p>そのため、<strong><span class="marker">標準偏差を求めるには、先に分散を求める必要があります。</span></strong></p>



<p>次に分散と標準偏差の計算方法を見ていきます。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">分散と標準偏差の求め方</h2>



<p>分散と標準偏差は次のように求めることができます。</p>



<ul class="wp-block-list">
<li><strong>分散：&#8221;各データと平均の差の2乗&#8221;の平均</strong></li>



<li><strong><span style="font-size: 1em; letter-spacing: 0.05em;">標準偏差：分散の平方根（ルート）</span></strong></li>
</ul>



<p>詳しく見ていきましょう。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading">分散の求め方</h3>



<p>分散は&#8221;各データと平均の差の2乗&#8221;の平均として求めることができます。</p>



<p>これを数式で表すと、次の式になります</p>


<div class="wp-block-image">
<figure class="aligncenter"><img decoding="async" width="1243" height="81" src="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/分散_式-2.png" alt="" class="wp-image-1872" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/分散_式-2.png 1243w, https://best-biostatistics.com/wp/wp-content/uploads/2019/10/分散_式-2-300x20.png 300w, https://best-biostatistics.com/wp/wp-content/uploads/2019/10/分散_式-2-768x50.png 768w, https://best-biostatistics.com/wp/wp-content/uploads/2019/10/分散_式-2-1024x67.png 1024w" sizes="(max-width: 1243px) 100vw, 1243px" /></figure>
</div>


<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>具体的な計算方法は下のように行います。</p>



<ol class="wp-block-list">
<li><strong>平均を計算する。</strong></li>



<li><strong>各観測データから平均を引く。</strong></li>



<li><strong>&#8220;各観測データから平均を引いた値&#8221;を2乗する。</strong></li>



<li><strong>&#8220;各観測データから平均を引いた値を2乗した値&#8221;をすべて足し合わせる。</strong></li>



<li><strong>最後に観測データの数で割る。</strong></li>
</ol>



<p>結構手順が多く、計算がめんどくさいですね。</p>



<p>どうして、このような計算方法をとるのでしょうか。</p>



<p>次に、説明していきます。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading">分散の考え方</h3>



<p>分散の計算が少しややこしいのは、</p>



<ol class="wp-block-list">
<li><strong>データのバラツキを正確に表すため</strong></li>



<li><strong>実は、数学的に計算を楽にするため</strong></li>
</ol>



<p>という理由があるからです。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>このことを、分散の考え方から説明していきます。</p>



<p>データのバラツキをどう評価したら良いかを考えてみます。</p>


<div class="wp-block-image">
<figure class="aligncenter"><img decoding="async" width="572" height="679" src="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/Fig1.png" alt="" class="wp-image-1873" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/Fig1.png 572w, https://best-biostatistics.com/wp/wp-content/uploads/2019/10/Fig1-253x300.png 253w" sizes="(max-width: 572px) 100vw, 572px" /></figure>
</div>


<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>このようなデータがあるとします。</p>



<p>このグラフでオレンジは平均で表しています。</p>


<div class="wp-block-image">
<figure class="aligncenter"><img decoding="async" width="572" height="679" src="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/Fig2-1.png" alt="" class="wp-image-1880" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/Fig2-1.png 572w, https://best-biostatistics.com/wp/wp-content/uploads/2019/10/Fig2-1-253x300.png 253w" sizes="(max-width: 572px) 100vw, 572px" /></figure>
</div>


<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>このとき、バラツキに対応するのは、データと平均の差（→）の部分です。</p>



<p><span class="marker">ちなみにデータと平均の差（→）のことを<strong>偏差</strong>と言います。</span></p>



<p>バラツキの評価するには、データと平均の差（→）を合計すればできます。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>このデータと平均の差（→）をどのように合計したら良いのでしょうか。</p>



<p>一番簡単な方法は、</p>



<ul class="wp-block-list">
<li><span style="color: #ff0000;"><strong>バラツキ（→）を全て足し合わせる</strong></span></li>
</ul>



<p>ことです。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>


<div class="wp-block-image">
<figure class="aligncenter"><img decoding="async" width="906" height="679" src="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/Fig3-2.png" alt="" class="wp-image-1877" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/Fig3-2.png 906w, https://best-biostatistics.com/wp/wp-content/uploads/2019/10/Fig3-2-300x225.png 300w, https://best-biostatistics.com/wp/wp-content/uploads/2019/10/Fig3-2-768x576.png 768w" sizes="(max-width: 906px) 100vw, 906px" /></figure>
</div>


<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>しかし、この方法には問題があります。</p>



<p>それは、<strong><span class="marker">データと平均の差には正の数と負の数の両方があります。</span></strong></p>



<p>そのため、<strong><span class="marker">ただ足し合わせるだけだと、正の数と負の数が互いに打ち消し合ってしまうため、バラツキは本来の値よりも小さくなってします。</span></strong></p>



<p>極端な場合では、正方向の差と負方向の差が等しいとき、バラツキが0になってしまうこともあります。</p>



<p>バラツキがあって、計算しているのに、バラルキが0になってしまうのはおかしいですよね。</p>



<p>次の方法は、</p>



<ul class="wp-block-list">
<li><strong>バラツキ（→）の&#8221;絶対値&#8221;を全て足し合わせる</strong></li>
</ul>



<p>ことです。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>


<div class="wp-block-image">
<figure class="aligncenter"><img decoding="async" width="1079" height="679" src="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/Fig4.png" alt="" class="wp-image-1878" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/Fig4.png 1079w, https://best-biostatistics.com/wp/wp-content/uploads/2019/10/Fig4-300x189.png 300w, https://best-biostatistics.com/wp/wp-content/uploads/2019/10/Fig4-768x483.png 768w, https://best-biostatistics.com/wp/wp-content/uploads/2019/10/Fig4-1024x644.png 1024w" sizes="(max-width: 1079px) 100vw, 1079px" /></figure>
</div>


<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>この方法は、さっきのすべてを足し合わせるよりも、データのバラツキを正確に表すことができています。</p>



<p>しかし、絶対値の計算は正の数と負の数を場合分けして考える必要があります。</p>



<p>そのため、<strong><span class="marker">数学的に面倒であるというデメリットがあります</span></strong>。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>そのため、分散ではデータのバラルキの評価に</p>



<ul class="wp-block-list">
<li><strong>バラツキ（→）の2乗を全て足し合わせる</strong></li>
</ul>



<p>という方法が用いられています。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading">標準偏差の求め方</h3>



<p>標準偏差の求め方は簡単です。</p>


<div class="wp-block-image">
<figure class="aligncenter"><img decoding="async" width="337" height="72" src="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/標準偏差_式-2.png" alt="" class="wp-image-1881" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/標準偏差_式-2.png 337w, https://best-biostatistics.com/wp/wp-content/uploads/2019/10/標準偏差_式-2-300x64.png 300w" sizes="(max-width: 337px) 100vw, 337px" /></figure>
</div>


<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>分散の平方根をとるだけです。</p>



<p>平方根をとる理由は、分散を計算するときに、データと平均の差を2乗したので、単位も実際のデータの2乗になっています。</p>



<p>例えば、<strong><span style="text-decoration: underline;">平均値の単位はmなのに、分散の単位はm<sup>2</sup>になっています</span></strong>。</p>



<p>これを元に戻す必要がありますよね。</p>



<p>そのため、分散の平方根を取って単位を平均値に合わせたのが標準偏差です。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading">標準偏差の名前</h3>



<p>標準偏差という名前は、データと平均の差を<strong>偏差</strong>ということに由来します。</p>



<p>データと平均の差の2乗は、つまり、偏差の2乗です。</p>



<p>偏差の2乗の平均が、分散です。</p>



<p>ここから、平方根により2乗を外したもののが、&#8221;標準&#8221;偏差です。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">分散と標準偏差の違い：平均値と同じ次元なのはどっち？</h2>



<p>ここまで分散と標準偏差の計算方法についてみてきました。</p>



<ul class="wp-block-list">
<li><strong>分散：&#8221;各データと平均の差（偏差）の2乗&#8221;の平均</strong></li>



<li><strong><span style="font-size: 1em; letter-spacing: 0.05em;">標準偏差：分散の平方根（ルート）</span></strong></li>
</ul>



<p>ここから違いを説明していきます。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>分散は、各データと平均の差（偏差）の2乗です。</p>



<p>そのため、<strong><span class="marker">分散は実際のデータとは次元が違います。</span></strong></p>



<p>例えば、テストの点のデータの分散は必ず、(点)<sup>2</sup>の次元を持ちます。</p>



<p>これでは、平均やデータと直接比較することができません。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>一方で、標準偏差は実際のデータと同じ次元を持ちます。</p>



<p>例えば、テストの点のデータの標準偏差は必ず、点とデータと次元を持ちます。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>よって、<strong><span class="marker">標準偏差は実際のデータと同じ次元を持つため、バラツキを評価するときは、分散より標準偏差の方が使いやすいです。</span></strong></p>



<p>これが、標準偏差の方がよく用いられる理由です。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<div class="swell-block-capbox cap_box"><div class="cap_box_ttl"><span>ポイント</span></div><div class="cap_box_content">
<ul class="wp-block-list">
<li>分散はその計算式の関係上、実際のデータの2乗の単位を持つ</li>



<li>標準偏差は、実際のデータと同じ単位を持つ</li>



<li>そのため、標準偏差の方が使いやすい</li>
</ul>
</div></div>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>実際に、<a href="https://best-biostatistics.com/review/table1_pvalue.html" data-type="post" data-id="5820">被験者背景の集計（いわゆるTable1）</a>では、分散ではなく標準偏差が使われます。</p>



<h2 class="wp-block-heading">まとめ</h2>



<ul class="wp-block-list">
<li>分散と標準偏差はどちらもデータのバラツキを表すパラメータです。</li>



<li>分散の求め方：&#8221;各データと平均の差（偏差）の2乗&#8221;の平均</li>



<li><span style="font-size: 1em; letter-spacing: 0.05em;">標準偏差の求め方：分散の平方根（ルート）</span></li>



<li><span style="font-size: 1em; letter-spacing: 0.05em;">標準偏差の方が、実際のデータと同じ次元を持つため使いやすい</span></li>
</ul>



<p>＞＞<a href="https://best-biostatistics.com/summary/normal_dist.html" target="_blank" rel="noopener noreferrer">正規分布とは？</a></p>



<p>＞＞<a href="https://best-biostatistics.com/summary/standard-norm.html" target="_blank" rel="noopener noreferrer">標準正規分布表の見方を徹底解説！</a></p>



<p>＞＞<a href="https://best-biostatistics.com/summary/sum-stat.html" target="_blank" rel="noopener noreferrer">要約統計量とは？何を出力すればいいの？</a></p>



<p>＞＞<a href="https://best-biostatistics.com/summary/95ci.html" target="_blank" rel="noopener noreferrer">95%信頼区間とは何？1.96の意味とは？</a></p>



<p>＞＞<a href="https://best-biostatistics.com/summary/hist.html" target="_blank" rel="noopener noreferrer">ヒストグラムとは？</a></p>



<p>＞＞<a href="https://best-biostatistics.com/excel/sd_excel.html">エクセルで標準偏差はどの関数を使えばいい？</a></p>
]]></content:encoded>
					
					<wfw:commentRss>https://best-biostatistics.com/summary/sd-variance.html/feed</wfw:commentRss>
			<slash:comments>5</slash:comments>
		
		
			</item>
		<item>
		<title>要約統計量とは何を出力すればいい？研究データの要約に必要なもの</title>
		<link>https://best-biostatistics.com/summary/sum-stat.html</link>
					<comments>https://best-biostatistics.com/summary/sum-stat.html#comments</comments>
		
		<dc:creator><![CDATA[beat1115]]></dc:creator>
		<pubDate>Thu, 03 Jul 2025 21:00:08 +0000</pubDate>
				<category><![CDATA[データを解析しよう]]></category>
		<guid isPermaLink="false">http://best-biostatistics.com/wp/2013/05/06/sum-stat/</guid>

					<description><![CDATA[<p><img src="https://best-biostatistics.com/wp/wp-content/uploads/2022/12/統計のYoutubeアイキャッチ-6-1024x576.jpg" class="webfeedsFeaturedVisual" /></p>統計学の重要な役割の一つに、データを要約するということがあります。統計と言えば平均値を出すだけ？いえいえ、それだけでは大切なことを見落としますよ。
]]></description>
										<content:encoded><![CDATA[<p><img src="https://best-biostatistics.com/wp/wp-content/uploads/2022/12/統計のYoutubeアイキャッチ-6-1024x576.jpg" class="webfeedsFeaturedVisual" /></p>
<p>データが得られたら、何をする必要があるでしょうか？</p>



<ul class="wp-block-list">
<li><strong>一つ一つのデータを確認する？</strong></li>



<li><strong>平均値を出してみる？</strong></li>



<li><strong>統計的検定をしてみる？</strong></li>
</ul>



<p>実は、どれも正解です。</p>



<p>得られたデータが少なければ、一つ一つ確認することも可能ですし、むしろそれがとても重要な場面があります。</p>



<p>しかし、サンプルサイズが大きくなってデータ量も膨大になってしまうと、データを一つ一つ確認することは不可能に近いです。</p>



<p>その際には、データを要約してみる。</p>



<p>つまり、要約統計量を算出してみるということが重要です。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p><a href="https://best-biostatistics.com/biostat/image.html" target="_blank" rel="noopener noreferrer">統計の役割は、２つありました</a>。</p>



<p>それが、要約することと、計画すること。</p>



<p>このページでは、その中の１つである「データを要約する」ことに関して重要な要約統計量を解説します。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">要約統計量とは？何を出力すればいいの？</h2>


<div class="wp-block-image">
<figure class="aligncenter"><img decoding="async" width="640" height="323" src="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/7f418be16ff229275d0670150ea529e0_s-e1577088780405.jpg" alt="要約統計量とは？何を出力すればいいの？" class="wp-image-2528" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/7f418be16ff229275d0670150ea529e0_s-e1577088780405.jpg 640w, https://best-biostatistics.com/wp/wp-content/uploads/2019/10/7f418be16ff229275d0670150ea529e0_s-e1577088780405-300x151.jpg 300w" sizes="(max-width: 640px) 100vw, 640px" /></figure>
</div>


<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>では、いざ要約統計量を出力しよう！と言われても、何を出力すれば良いか、途方に暮れてしまいますよね。</p>



<p><a href="https://best-biostatistics.com/summary/2group.html" target="_blank" rel="noopener noreferrer">2群間の比較の統計解析は？</a>でも書きましたが、基本的には以下の表が作れればOKです。</p>



<p>（例えば、男性と女性ごとに要約統計量を出力したい場合です）</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<figure class="wp-block-table"><table class="has-fixed-layout"><tbody><tr><td></td><td>男性</td><td>女性</td></tr><tr><td>平均値（SD）</td><td>XXX（XX）</td><td>YYY（YY）</td></tr><tr><td>中央値</td><td>XXX</td><td>YYY</td></tr><tr><td>範囲</td><td>XXX-XXX</td><td>YYY-YYY</td></tr><tr><td>四分位範囲</td><td>XXX-XXX</td><td>YYY-YYY</td></tr><tr><td>95%信頼区間</td><td>XXX-XXX</td><td>YYY-YYY</td></tr></tbody></table></figure>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>まとめると、以下の6つの指標が連続量（量的データ）の要約統計量には必要ですね。</p>



<ol class="wp-block-list">
<li><strong>平均値</strong></li>



<li><strong>標準偏差</strong></li>



<li><strong>中央値</strong></li>



<li><strong>四分位範囲</strong></li>



<li><strong>範囲</strong></li>



<li><strong>95%信頼区間</strong></li>
</ol>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>要約統計量として、これら6つの指標が出力されていれば、全く問題ないでしょう。</p>



<p>95%信頼区間は要約というより推定の範囲に入りますが、平均値の推定精度を手元で把握するためには重要なデータなので、ぜひ出力しておくことをお勧めします。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading">要約統計量のためのグラフ：ヒストグラムと箱ひげ図</h3>



<p>要約統計量では6つの指標を出力すればOKということを学びました。</p>



<p>しかし、表に数値だけ出されても、あんまりイメージできないですよね。</p>



<p>そのため、ちゃんとグラフを使って可視化することも重要です。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>要約統計量のためグラフは、2つあると便利です。</p>



<ol class="wp-block-list">
<li><strong>ヒストグラム</strong></li>



<li><strong>箱ひげ図</strong></li>
</ol>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p><a href="https://best-biostatistics.com/summary/hist.html" target="_blank" rel="noopener noreferrer">ヒストグラムは、データが正規分布かどうかを把握するために重要なグラフ</a>になります。</p>



<p><a href="https://best-biostatistics.com/toukei-kentei/box-plot.html" target="_blank" rel="noopener noreferrer">箱ひげ図は、平均値、中央値、四分位範囲、範囲が一目でわかる、めちゃめちゃ便利なグラフ</a>です。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>なので、先ほどの6つの要約統計量にプラスして、ヒストグラムと箱ひげ図を出力すれば、かなり良いデータの要約をしていることになります。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading">要約統計量の英語表現</h3>



<p>英語論文を書く上で、各要約統計量の英語表現が必要ですよね。</p>



<p>そのため、上記の要約統計量の指標の英語表現をお伝えします。</p>



<p>ちなみに要約統計量自体の英語表現は、<strong><span style="text-decoration: underline;">Summary Statistics</span></strong>が用いられることが多い印象です。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<ol class="wp-block-list">
<li><strong>平均値：Mean</strong></li>



<li><strong>標準偏差：Standard Deviation (SD)</strong></li>



<li><strong>中央値：Median</strong></li>



<li><strong>四分位範囲：Interquartile Range (IQR)</strong></li>



<li><strong>範囲：Range</strong></li>



<li><strong>95%信頼区間：95% Confidence Interval (95%CI)</strong></li>



<li><strong>ヒストグラム：Histogram</strong></li>



<li><strong>箱ひげ図：Box plot</strong></li>
</ol>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">要約統計量として平均値と中央値以外の代表値</h2>


<div class="wp-block-image">
<figure class="aligncenter"><img decoding="async" width="640" height="345" src="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/987eca87017b5f2fa265f89558d4724a_s-e1577496841202.jpg" alt="要約統計量として平均値と中央値以外の代表値" class="wp-image-2530" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/987eca87017b5f2fa265f89558d4724a_s-e1577496841202.jpg 640w, https://best-biostatistics.com/wp/wp-content/uploads/2019/10/987eca87017b5f2fa265f89558d4724a_s-e1577496841202-300x162.jpg 300w" sizes="(max-width: 640px) 100vw, 640px" /></figure>
</div>


<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>代表値とは、<a href="https://best-biostatistics.com/summary/diff-mean-median.html" target="_blank" rel="noopener noreferrer">平均値や中央値</a>などのように、データの特徴を表す統計量です。</p>



<p>要約統計量としては、<a href="https://best-biostatistics.com/summary/diff-mean-median.html" target="_blank" rel="noopener noreferrer">平均値や中央値</a>を出力する必要がありましたね。</p>



<p>そのほかにも、代表値としては<strong><span class="marker">最頻値</span></strong>があります。</p>



<p><strong><span class="marker">最頻値とは、もっともデータが集中している値</span></strong>のことをいいます。</p>



<p><a href="https://best-biostatistics.com/summary/hist.html">ヒストグラム</a>を書いた時に、一番山が高い部分ですね。</p>



<p>たとえば、以下のヒストグラムであれば、170センチの階級の度数が一番多いので、ここが最頻値になります。</p>







<figure class="wp-block-image"><img decoding="async" width="752" height="452" src="https://best-biostatistics.com/wp/wp-content/uploads/2018/10/histo1.png" alt="要約統計量として平均値と中央値以外の代表値" class="wp-image-467" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2018/10/histo1.png 752w, https://best-biostatistics.com/wp/wp-content/uploads/2018/10/histo1-300x180.png 300w, https://best-biostatistics.com/wp/wp-content/uploads/2018/10/histo1-375x225.png 375w" sizes="(max-width: 752px) 100vw, 752px" /></figure>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">要約統計量として標準偏差や四分位範囲などのバラツキの指標の役割</h2>



<p>データはばらつきます。</p>



<p>例えば、大学生の体重が知りたいという疑問があったとき、日本全国の大学生（<span style="color: #ff0a0a;">母集団</span>）の体重を知ることは実質不可能なため、近くの大学で10人（<span style="color: #ff0a0a;">標本</span>）の体重を教えてもらいました。</p>



<p>すると、以下のような表のとおりのデータが得られました。<!-- ★テーブルタグここから★ --></p>



<figure class="wp-block-table"><table class="has-fixed-layout"><tbody><tr><td></td><td>大学生１</td><td>大学生２</td><td>大学生３</td><td>大学生４</td><td>大学生５</td><td>大学生６</td><td>大学生７</td><td>大学生８</td><td>大学生９</td></tr><tr><td>体重</td><td>50.4</td><td>54.6</td><td>55.2</td><td>58.4</td><td>64.3</td><td>65.5</td><td>69.1</td><td>71.4</td><td>74.5</td></tr></tbody></table></figure>



<p><!-- ★テーブル用スタイルここまで★ --><!-- ★テーブルタグここまで★ --><br>この表からまず分かるのは、「<strong><span style="color: #ff0a0a;">同じデータがない</span></strong>」ということです。</p>



<p>これは当たり前かと思いますが、<strong><span class="marker">同じデータがないと認識することからバラツキの指標を出力するということを考え出す</span></strong>からです。</p>



<p>同じデータがないため、私たちは平均値や中央値という代表値でデータの特徴をつかみ、さらにバラツキの指標を用いることでデータのイメージを膨らますことが出来ます。</p>



<p>その前提に立つと、どれぐらいばらついているのか？ということに興味が出てくるでしょう。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>この時に重要なバラツキの指標が、<strong><a href="https://best-biostatistics.com/summary/normal_dist.html">標準偏差</a>と四分位範囲</strong>です。</p>



<p><span class="marker">標準偏差は、平均値に対応したバラツキの指標</span>。</p>



<p>一方の<span class="marker">四分位範囲は、中央値に対応したバラツキの指標</span>です。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">要約統計量でデータを把握することは、とても重要</h2>



<p>要約統計量で出力する指標、そしてヒストグラムと<a href="https://best-biostatistics.com/toukei-kentei/box-plot.html">箱ひげ図</a>。</p>



<p>これらを出力することは、それほど難しくありません。</p>



<p>でも、とても重要な統計解析の方法ですし、立派に統計解析をやっていると胸を張って言っていいです。</p>



<p>統計って難しいというイメージがあるので、なんとなくデータを要約しただけでは不十分なんじゃないの・・・？という不安を持つ方がいらっしゃるみたいですね。</p>



<p>でも、よく理解してもいない<a href="https://best-biostatistics.com/hypo_test/test.html">統計学的検定</a>をやってみて<a href="https://best-biostatistics.com/hypo_test/p-value.html">P値が0.05を下回るかどうか</a>で一喜一憂するよりも、要約統計量を出力してちゃんとデータと向き合うほうが、とても重要なのです。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p><strong><span class="marker">「統計＝検定」ではない。</span></strong></p>



<p>このことを再度認識してくださいね！</p>







<h2 class="wp-block-heading">要約統計量に関するまとめ</h2>


<div class="wp-block-image">
<figure class="aligncenter"><img decoding="async" width="700" height="369" src="https://best-biostatistics.com/wp/wp-content/uploads/2016/02/efefaqq.jpg" alt="要約統計量に関するまとめ" class="wp-image-2624" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2016/02/efefaqq.jpg 700w, https://best-biostatistics.com/wp/wp-content/uploads/2016/02/efefaqq-300x158.jpg 300w" sizes="(max-width: 700px) 100vw, 700px" /></figure>
</div>


<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>要約統計量は、以下の6つの指標が必要です。</p>



<ol class="wp-block-list">
<li><strong>平均値</strong></li>



<li><strong>標準偏差</strong></li>



<li><strong>中央値</strong></li>



<li><strong>四分位範囲</strong></li>



<li><strong>範囲</strong></li>



<li><strong>95%信頼区間</strong></li>
</ol>



<p>このほかにも、要約統計量のためグラフは、2つ出力すると良い。</p>



<ol class="wp-block-list">
<li><strong>ヒストグラム</strong></li>



<li><strong>箱ひげ図</strong></li>
</ol>
]]></content:encoded>
					
					<wfw:commentRss>https://best-biostatistics.com/summary/sum-stat.html/feed</wfw:commentRss>
			<slash:comments>4</slash:comments>
		
		
			</item>
		<item>
		<title>例数と件数の違いは？有害事象や副作用報告で使われる2つの数値の意味</title>
		<link>https://best-biostatistics.com/summary/number_of.html</link>
					<comments>https://best-biostatistics.com/summary/number_of.html#respond</comments>
		
		<dc:creator><![CDATA[beat1115]]></dc:creator>
		<pubDate>Sun, 29 Jun 2025 21:00:10 +0000</pubDate>
				<category><![CDATA[データを解析しよう]]></category>
		<guid isPermaLink="false">https://best-biostatistics.com/?p=5779</guid>

					<description><![CDATA[<p><img src="https://best-biostatistics.com/wp/wp-content/uploads/2022/04/統計のYoutubeアイキャッチ-5-1024x576.jpg" class="webfeedsFeaturedVisual" /></p>この記事では「例数と件数の違いは？有害事象や副作用報告で使われる2つの数値の意味」ということでお伝えします。 有害事象や副作用報告などでよく見る、本試験での有害事象はXX例YY件だった、というような記載。 よくよく考えれ [&#8230;]]]></description>
										<content:encoded><![CDATA[<p><img src="https://best-biostatistics.com/wp/wp-content/uploads/2022/04/統計のYoutubeアイキャッチ-5-1024x576.jpg" class="webfeedsFeaturedVisual" /></p>
<p>この記事では「例数と件数の違いは？有害事象や副作用報告で使われる2つの数値の意味」ということでお伝えします。</p>



<p><a href="https://best-biostatistics.com/summary/ae-adr.html">有害事象や副作用</a>報告などでよく見る、本試験での有害事象はXX例YY件だった、というような記載。</p>



<p>よくよく考えれば、例数と件数の違いってどこにあるんだろうか？という疑問が湧きますよね。</p>



<p>そのためこの記事では</p>



<ul class="wp-block-list">
<li><strong>例数と件数の違い</strong></li>



<li><strong>例数の解析と件数の解析の仕方</strong></li>
</ul>



<p>についてお伝えしていきます！</p>



<h2 class="wp-block-heading">例数と件数の違いとは？</h2>



<figure class="wp-block-image"><img decoding="async" width="2560" height="1146" src="https://best-biostatistics.com/wp/wp-content/uploads/2022/04/AdobeStock_128416864-scaled.jpeg" alt="" class="wp-image-5764" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2022/04/AdobeStock_128416864-scaled.jpeg 2560w, https://best-biostatistics.com/wp/wp-content/uploads/2022/04/AdobeStock_128416864-300x134.jpeg 300w, https://best-biostatistics.com/wp/wp-content/uploads/2022/04/AdobeStock_128416864-1024x459.jpeg 1024w, https://best-biostatistics.com/wp/wp-content/uploads/2022/04/AdobeStock_128416864-768x344.jpeg 768w, https://best-biostatistics.com/wp/wp-content/uploads/2022/04/AdobeStock_128416864-1536x688.jpeg 1536w, https://best-biostatistics.com/wp/wp-content/uploads/2022/04/AdobeStock_128416864-2048x917.jpeg 2048w" sizes="(max-width: 2560px) 100vw, 2560px" /></figure>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>そもそも例数と件数はどう違うのでしょうか？</p>



<p>結論から言えば、<span class="marker"><strong>例数は「症例数」を数えているもので、件数とは「事象数」を数えている、という違い</strong></span>です。</p>



<p>具体的に、有害事象の例で考えてみましょう。</p>



<h3 class="wp-block-heading">例数と件数の違いを有害事象で考えてみる</h3>



<p>まずは例数と件数の違いを有害事象で考えてみましょう。</p>



<p>Aさん、Bさん、Cさんの3人がいて、試験中に以下のように有害事象が発生したとします。</p>



<figure class="wp-block-image"><img decoding="async" width="831" height="426" src="https://best-biostatistics.com/wp/wp-content/uploads/2022/04/ScreenShot-2022-04-27-10.22.52.png" alt="" class="wp-image-5780" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2022/04/ScreenShot-2022-04-27-10.22.52.png 831w, https://best-biostatistics.com/wp/wp-content/uploads/2022/04/ScreenShot-2022-04-27-10.22.52-300x154.png 300w, https://best-biostatistics.com/wp/wp-content/uploads/2022/04/ScreenShot-2022-04-27-10.22.52-768x394.png 768w" sizes="(max-width: 831px) 100vw, 831px" /></figure>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>この時、「頭痛」という有害事象はAさんとBさんに起こっているため、2例に発現しています。</p>



<p>そしてAさんは頭痛を1回、Bさんは頭痛を2回発現しているため、3件発現したことになります。</p>



<p>そして「風邪」はAさんにだけ1回発現しているため、1例1件の発現、という数え方です。</p>



<p>そのため今回の例だと、以下のような数え方になります。</p>



<ul class="wp-block-list">
<li><strong>有害事象の発現は2例4件</strong></li>



<li><strong>頭痛の発現は2例3件</strong></li>



<li><strong>風邪の発現は1例1件</strong></li>
</ul>



<p>そのため、<span class="marker"><strong>例数は「その有害事象を発現したかどうかの有無」を数えていることに相当し、件数は「その有害事象を発現した回数」を数えていることに相当する</strong></span>ことがわかります。</p>



<h3 class="wp-block-heading">件数の数え方は「定義」によって異なる</h3>



<p>件数の数え方は、実はとても複雑です。</p>



<p>というのも、件数の数え方は「定義」によって異なるから。</p>



<p>例えば以下のように、<span style="text-decoration: underline;">最初に頭痛を発現した2日後も頭痛があった場合</span>は、どのように数えたら良いでしょうか？</p>



<figure class="wp-block-image"><img decoding="async" width="784" height="313" src="https://best-biostatistics.com/wp/wp-content/uploads/2022/04/ScreenShot-2022-04-27-10.31.23.png" alt="" class="wp-image-5781" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2022/04/ScreenShot-2022-04-27-10.31.23.png 784w, https://best-biostatistics.com/wp/wp-content/uploads/2022/04/ScreenShot-2022-04-27-10.31.23-300x120.png 300w, https://best-biostatistics.com/wp/wp-content/uploads/2022/04/ScreenShot-2022-04-27-10.31.23-768x307.png 768w" sizes="(max-width: 784px) 100vw, 784px" /></figure>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>考え方としては2通り考えられて、</p>



<ul class="wp-block-list">
<li><strong>最初の頭痛が続いていると考える（この場合、1件と数える）</strong></li>



<li><strong>新たな頭痛が発現したと考える（この場合、2件と数える）</strong></li>
</ul>



<p>どっちの定義を採用するかで、1件になるのか2件になるのかが変わります。</p>



<p>そのため重要なのは、件数の数え方の定義を事前にちゃんと決めておく、ということです。</p>



<p>定義に対して正解や不正解はなく、「この試験ではこの定義で件数を数えました」という計画を立てていること自体が重要になるんです。</p>



<h2 class="wp-block-heading">例数の解析・件数の解析</h2>



<figure class="wp-block-image"><img decoding="async" width="2560" height="1548" src="https://best-biostatistics.com/wp/wp-content/uploads/2022/04/AdobeStock_349572283-scaled-e1650244010559.jpeg" alt="" class="wp-image-5702" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2022/04/AdobeStock_349572283-scaled-e1650244010559.jpeg 2560w, https://best-biostatistics.com/wp/wp-content/uploads/2022/04/AdobeStock_349572283-scaled-e1650244010559-300x181.jpeg 300w, https://best-biostatistics.com/wp/wp-content/uploads/2022/04/AdobeStock_349572283-scaled-e1650244010559-1024x619.jpeg 1024w, https://best-biostatistics.com/wp/wp-content/uploads/2022/04/AdobeStock_349572283-scaled-e1650244010559-768x464.jpeg 768w, https://best-biostatistics.com/wp/wp-content/uploads/2022/04/AdobeStock_349572283-scaled-e1650244010559-1536x929.jpeg 1536w, https://best-biostatistics.com/wp/wp-content/uploads/2022/04/AdobeStock_349572283-scaled-e1650244010559-2048x1238.jpeg 2048w" sizes="(max-width: 2560px) 100vw, 2560px" /></figure>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>例数と件数の違いがわかったところで、例数と件数のそれぞれの解析手法について解説していきます。</p>



<h3 class="wp-block-heading">例数の解析の仕方</h3>



<p>例数に関しては上述の通り、「その有害事象を発現したかどうかの有無」を数えているため、データとしては<a href="https://best-biostatistics.com/biostat/data.html">2値のカテゴリカルデータ</a>になります。</p>



<p>2値のカテゴリカルデータであれば、例数を数えるだけでなく、目的によっては</p>



<ul class="wp-block-list">
<li><strong><a href="https://best-biostatistics.com/contingency/contingency-kiso.html">分割表</a>を作成して<a href="https://best-biostatistics.com/contingency/odds_risk.html">オッズ比やリスク比</a>を算出</strong></li>



<li><strong><a href="https://best-biostatistics.com/contingency/chi-square.html">カイ二乗検定</a>（もしくは<a href="https://best-biostatistics.com/contingency/fisher-exact.html">フィッシャーの正確確率検定</a>）</strong></li>



<li><a href="https://best-biostatistics.com/correlation_regression/logistic.html"><strong>ロジスティック回帰分析</strong></a></li>
</ul>



<p>なんかを適用することが可能です。</p>



<h3 class="wp-block-heading">件数の解析の仕方</h3>



<p>一方で、件数の解析の仕方は複雑です。</p>



<p>件数は「その有害事象を発現した回数」を数えていることに相当するため、本質的にはカウントデータの扱いになります。</p>



<p><span class="marker"><strong>2値のカテゴリカルデータではないため、例数のように分割表を作ったりカイ二乗検定を実施したり、ロジスティック回帰分析を適用させることはできない</strong></span>のです。</p>



<p>メルマガ会員からの質問で「件数に対してカイ二乗検定を実施していいですか？」を聞かれることがあるのですが、件数に対してカイ二乗検定はNGなんです。</p>



<p>じゃあどんな解析ができるかと言えば、以下の2パターン。</p>



<ul class="wp-block-list">
<li><strong>ポアソン回帰もしくは<a href="https://best-biostatistics.com/correlation_regression/negative-binomial.html">負の二項回帰</a></strong></li>



<li><strong><a href="https://best-biostatistics.com/summary/jinnennhou.html">人年法</a></strong></li>
</ul>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">まとめ</h2>



<figure class="wp-block-image"><img decoding="async" width="2560" height="1164" src="https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_101008656-scaled-e1637541296894.jpeg" alt="" class="wp-image-5331" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_101008656-scaled-e1637541296894.jpeg 2560w, https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_101008656-scaled-e1637541296894-300x136.jpeg 300w, https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_101008656-scaled-e1637541296894-1024x466.jpeg 1024w, https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_101008656-scaled-e1637541296894-768x349.jpeg 768w, https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_101008656-scaled-e1637541296894-1536x698.jpeg 1536w, https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_101008656-scaled-e1637541296894-2048x931.jpeg 2048w" sizes="(max-width: 2560px) 100vw, 2560px" /></figure>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>いかがでしたか？</p>



<p>この記事では「例数と件数の違いは？有害事象や副作用報告で使われる2つの数値の意味」ということでお伝えしました。</p>



<ul class="wp-block-list">
<li><strong>例数と件数の違い</strong></li>



<li><strong>数の解析と件数の解析の仕方</strong></li>
</ul>



<p>について理解につながったのなら幸いです！</p>
]]></content:encoded>
					
					<wfw:commentRss>https://best-biostatistics.com/summary/number_of.html/feed</wfw:commentRss>
			<slash:comments>0</slash:comments>
		
		
			</item>
	</channel>
</rss>
