母集団と標本

統計学の最終的な目標

皆さんは、統計学は最終的に何を知りたいか、ということを意識したことはありますでしょうか?我々は目の前のデータを要約したり検定したりすることが目標なのでしょうか?もちろん、そういった側面があるということも事実です。ですが、それだけでは統計学に振り回されてしまいます。統計学が最終的に目標としていることを知ることで、もっとそのデータの意味を知ることが可能になります。

 

母集団という用語を整理する

「母集団」という言葉があります。統計学の最終目標は、母集団を推定することにあります。これを理解するには、まずはこの母集団と真値いう用語を整理しましょう。例えば、2016年における日本の小学6年生の身長と体重が知りたい、といった時に、どのように調べればよいでしょうか?方法としては2つ考えられます。

 

一つは、2016年における日本の小学6年生の身長と体重を測定してしまうこと。これが出来れば、全く問題なく2016年の小学6年生の身長と体重を知ることが出来ます。そして、この2016年における日本の小学6年生全員のことを「母集団」と呼びます。もっと一般化して言うと、「興味がある対象の、すべての人」が母集団ということになります。
違う例でいうと、2016年の日本の30歳の年収を知りたいとしたら、2016年の日本の30歳全員が母集団ということになります。

 

そして、母集団から得られる値を真値と呼びます。2016年における日本の小学6年生全員の身長及び体重の平均値、などがそれに当たります。母集団を対象とするということは、対象が過不足なく選ばれているということなので、その時の平均値と異なる平均値が出てくるはずがありません。そういった意味で、真値と呼びます。

 

標本という用語を整理する

上述した通り、興味のある対象全ての人を測定できれば一番良いのですが、それには限界があります。そのため、我々は日常、興味ある対象の一部を選出し、選出された人のデータを扱うことになります。この興味ある対象の一部を「標本」と呼びます。例えば、2016年における日本の小学6年生を対象とするなら、「2016年の東京都の小学6年生」が標本に当たります。そのほかにも、「2016年の佐藤という名字の小学6年生」も標本の一つになります。

 

ご想像の通り、母集団を直接測定することはすごく難しいことです。それは費用や手間という観点からです。それは対象が大きくなればなるほど難しくなります。しかし、日本では5年ごとに母集団の調査を行っています。それが国勢調査です。国勢調査によって、日本人全員という母集団のデータを調査しているのです。

 

統計の最終的な目標は、標本から母集団を推定すること

統計学の最終的な目標は、標本から母集団を推定することにあります。我々は母集団のデータを直接得ることが難しく、一部の標本のデータを扱うことになります。ですが、本当に知りたい情報は、母集団のデータになるはずです。そのため、統計学とは標本のデータから母集団を推定すること、が最終目的になるのです。
以下の図を見てください。これが統計学の目的とする、母集団と標本の関係です。

 



data-ad-client="ca-pub-8866234902868600"
data-ad-slot="5243035170"
data-ad-format="auto">



HOME プロフィール お問い合わせ