母集団と標本

統計学の最終的な目標

皆さんは、統計学は最終的に何を知りたいか、ということを意識したことはありますでしょうか?我々は目の前のデータを要約したり検定したりすることが目標なのでしょうか?もちろん、そういった側面があるということも事実です。ですが、それだけでは統計学に振り回されてしまいます。統計学が最終的に目標としていることを知ることで、もっとそのデータの意味を知ることが可能になります。

 

母集団という用語を整理する

「母集団」という言葉があります。統計学の最終目標は、母集団を推定することにあります。これを理解するには、まずはこの母集団と真値いう用語を整理しましょう。例えば、2016年における日本の小学6年生の身長と体重が知りたい、といった時に、どのように調べればよいでしょうか?方法としては2つ考えられます。

 

一つは、2016年における日本の小学6年生の身長と体重を測定してしまうこと。これが出来れば、全く問題なく2016年の小学6年生の身長と体重を知ることが出来ます。そして、この2016年における日本の小学6年生全員のことを「母集団」と呼びます。もっと一般化して言うと、「興味がある対象の、すべての人」が母集団ということになります。
違う例でいうと、2016年の日本の30歳の年収を知りたいとしたら、2016年の日本の30歳全員が母集団ということになります。

 

そして、母集団から得られる値を真値と呼びます。2016年における日本の小学6年生全員の身長及び体重の平均値、などがそれに当たります。母集団を対象とするということは、対象が過不足なく選ばれているということなので、その時の平均値と異なる平均値が出てくるはずがありません。そういった意味で、真値と呼びます。

 

標本という用語を整理する

上述した通り、興味のある対象全ての人を測定できれば一番良いのですが、それには限界があります。そのため、我々は日常、興味ある対象の一部を選出し、選出された人のデータを扱うことになります。この興味ある対象の一部を「標本」と呼びます。例えば、2016年における日本の小学6年生を対象とするなら、「2016年の東京都の小学6年生」が標本に当たります。そのほかにも、「2016年の佐藤という名字の小学6年生」も標本の一つになります。

 

ご想像の通り、母集団を直接測定することはすごく難しいことです。それは費用や手間という観点からです。それは対象が大きくなればなるほど難しくなります。しかし、日本では5年ごとに母集団の調査を行っています。それが国勢調査です。国勢調査によって、日本人全員という母集団のデータを調査しているのです。

 

統計の最終的な目標は、標本から母集団を推定すること

統計学の最終的な目標は、標本から母集団を推定することにあります。我々は母集団のデータを直接得ることが難しく、一部の標本のデータを扱うことになります。ですが、本当に知りたい情報は、母集団のデータになるはずです。そのため、統計学とは標本のデータから母集団を推定すること、が最終目的になるのです。
以下の図を見てください。これが統計学の目的とする、母集団と標本の関係です。

 

統計は難しい。
これは、私が統計を仕事とする前までに抱いていた幻です。

ですが、実はデータをまとめたり、結果を解釈するだけであれば、それほど難しい知識は不要であることに気付きました。
そして、統計が何をやっているのかを「イメージとしてとらえる」ことが重要であると感じたのです。

こちらのメルマガでは、統計をイメージとしてとらえられるように、動画でまとめました。
今ならメルマガ登録の無料特典として以下の3つの資料を進呈しております。

1.イメージでとらえる統計学
2.イメージでとらえる推定
3.イメージでとらえるP値

ぜひ登録して、イメージを持った統計学への扉を開いてください。
登録はこちらです。

https://maroon-ex.jp/fx46970/oQ2DkN

HOME プロフィール お問い合わせ