不偏分散とは?n-1で割る理由や求め方を簡単にわかりやすく解説!

不偏分散とは?n-1で割る理由や求め方を簡単にわかりやすく解説!

統計での分散には、”nで割る分散”と”n-1で割る分散”の二種類があります。

“nで割る分散”は、一般的な分散です。

“n-1で割る分散”を不偏分散と呼びます。

 

この記事では、

  • 一般的な分散と不偏分散では何が違うのか。
  • どうして、不偏分散はn-1で割る必要があるのか。
  • 分散と不偏分散の使い分け方

ついて説明していきます。

 

>>もう統計で悩むのは終わりにしませんか? 

↑期間・数量限定で無料プレゼント中!

目次

不偏分散と標本分散の違いは?n-1で割る理由

まずは、標本分散と普遍分散の違いについて。

  • 標本分散:データのバラツキを表すために用いられる
  • 不偏分散:標本から母集団の分散を推定するために用いられる

そして分散には母分散と標本分散があります。

“標本分散”と”不偏分散”の違いを理解するためには、まず、母集団と標本の性質について知る必要があります。

 

不偏分散を理解するのに必要な母集団と標本とは?

母集団と標本の意味は以下のようです。

  • 母集団は“知りたい対象のすべて”を指します。
  • 標本は“知りたい対象の一部”を指します。

母集団と標本の関係性は意味は以下のようです。

  • “知りたい対象のすべて”を調べるために、“知りたい対象の一部”を調べることを”抽出“と言います。
  • “知りたい対象の一部”から”知りたい対象のすべて”を予測することを”推定“と言います。

詳しくは、母集団と標本の関係とはでも説明しています!

“標本分散”と”不偏分散”が使われるのは、母集団から抽出した標本の性質に由来します。

 

不偏分散がn-1で割る分散

母集団と標本の関係には

“母集団の性質と、母集団から抽出した標本の性質は一緒ではない”という性質があります。

母集団の、平均、分散、標準偏差と、

標本の、平均、分散、標準偏差は、

一致するとは限りません(偶然一致することはあります)。

 

そのため、統計学では母集団と標本の統計の値は区別して考えられています

統計学では母集団と標本の統計の値は区別して考えるため、

母集団の分散を母分散

標本の分散を標本分散と呼びます。

 

標本分散は、式ではこのように書きます。

 

多くの調査や研究は、母集団の性質を明らかにするが目的で行われています。

しかし、母集団を調査することは、コストや技術的に不可能なことが多いです。

 

そこで、標本から母集団を推定する必要が生まれます。

標本から母集団の分散を推定するために、不偏分散が用いられます。

不偏分散は、式ではこのように書きます。

(観測データ-1)と、データ数から1を引くのが標本分散との違いです。

これが俗にいうn-1の分散。

 

ここまでの話をまとめると、

  • 母集団の分散を母分散という
  • 標本の分散を標本分散という
  • 標本から母集団の分散を推定した分散を不偏分散という

 

不偏分散の名前の由来:分散の不偏推定量だから

不偏分散という名前は、不偏分散分散の不偏推定量であることに由来します。

 

標本から母集団の性質を推定するために、不偏推定量というものが用いられます。

不偏とは、漢字の通り、”偏りのないもの”という意味です。

統計学には、“平均的に過大にも過少にも推定していない”という意味です。

 

“母集団の性質と、母集団から抽出した標本の性質は一緒ではない”という性質により、

標本の性質は、母集団と比べたとき、偏りが生じてしまいます。

この偏りを補正することで、母集団の性質を推定したものを不偏推定量といます。

 

どうして、不偏分散はn-1で割るのか?

不偏分散で、n-1で割るのは”偏り”を補正するためです。

 

先ほど、”母集団の性質と、母集団から抽出した標本の性質は一緒ではない”と説明しました。

これは、標本の性質は、母集団の性質と比べてからみて”偏り”といえます。

不偏分散で、n-1で割るのはこのかたよりを補正するためです。

 

具体的には、

標本分散は母分散よりも小さくなるという性質に由来します。

これを防ぐために、n-1で割ります。

1を引くと分母が小さくなるので、分散は少し大きくなります。

 

 

不偏分散から不偏標準偏差へ:注意してほしいこと

不偏〇〇というのは、母集団の性質の不偏推定量と上で説明しました。

そのため、不偏標準偏差を母集団の標準偏差(母標準偏差)として定義します。

 

しかし、多くの文献やネットの情報では、

“不偏分散の平方根”を、不偏標準偏差として定義していますが、

これは誤用なので気をつけてください。

 

正しい不偏標準偏差は、“不偏分散の平方根を補正した値”です。

“不偏分散の平方根”“不偏分散の平方根”や”不偏分散平方根”として定義されています。

 

しかし、Excelなどでは、“不偏分散平方根”の計算が用いられており、名称以外はそこまで意識する必要はありません。

 

 

>>もう統計で悩むのは終わりにしませんか? 

↑1万人以上の医療従事者が購読中

不偏分散と標本分散はどちらを使うべき?

  • データの分散が知りたいとき:分散(標本分散 or 母分散)
  • データから母集団の性質を推定したいとき:不偏分散

 

母集団の推定が目的のときは、不偏分散を用います。

クラスのテストの結果など、母集団のデータが揃っている場合は、分散を用います。

標準偏差のときは

  • データの標準偏差が知りたいとき:標準偏差(標本標準偏差 or 母標準偏差)
  • データから母集団の性質を推定したいとき:不偏標準偏差 or 不偏分散平方根

 

標準偏差と分散の関係については、こちらの記事をご覧ください!

>>標準偏差と分散の関係は?

 

不偏分散を求めるのにエクセルでの関数は?

最後に、エクセルで分散または、不偏分散または不偏標準偏差を用いる時に使う関数について紹介します。

分散と不偏分散

分散(標本分散 or 母分散) VAR.P
不偏分散 VAR または VAR.S

 

標準偏差と不偏標準偏差または不偏分散平方根

標準偏差(標本標準偏差 or 母標準偏差) STDEV.P
不偏標準偏差 該当なし
不偏分散の平方根 STDEV または STDEV.S

 

まとめ

  • 母集団の分散を母分散という
  • 標本の分散を標本分散という
  • 標本から母集団の分散を推定した分散を不偏分散という
  • 不偏分散で、n-1で割るのは”偏り”を補正するため

 

>>要約統計量とは?何を出力すればいいの?

>>95%信頼区間とは何?1.96の意味とは?

>>母集団と標本の違いとは?

>>標準偏差と分散の関係は?

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

リサーチクエスチョン探し?データ分析?論文投稿?、、、で、もう悩まない!

第1章臨床研究ではなぜ統計が必要なのか?計画することの重要性
  • 推定ってどんなことをしているの?
  • 臨床研究を計画するってどういうこと?
  • どうにかして標本平均を母平均に近づけられないか?
第2章:研究目的をどれだけ明確にできるのかが重要
  • データさえあれば解析でどうにかなる、という考え方は間違い
  • 何を明らかにしたいのか? という研究目的が重要
  • 研究目的は4種類に分けられる
  • 統計専門家に相談する上でも研究目的とPICOを明確化しておく
第3章:p値で結果が左右される時代は終わりました
  • アメリカ統計協会(ASA)のp値に関する声明で指摘されていること
  • そうは言っても、本当に有意差がなくてもいいの…?
  • なぜ統計専門家はp値を重要視していないのか
  • 有意差がない時に「有意な傾向があった」といってもいい?
  • 統計を放置してしまうと非常にまずい
第4章:多くの人が統計を苦手にする理由
  • 残念ながら、セミナー受講だけで統計は使えません。
  • インプットだけで統計が使えない理由
  • どうやったら統計の判断力が鍛えられるか?
  • 統計は手段なので正解がないため、最適解を判断する力が必要
第5章:統計を使えるようになるために今日から何をすれば良いか?
  • 論文を読んで統計が使えるようになるための5ステップ
第6章:統計を学ぶために重要な環境
  • 統計の3つの力をバランスよく構築する環境

以下のボタンをクリックして、画面に出てくる指示に従って、必要事項を記入してください。

コメント

コメントする

目次