バラツキの指標

データはばらつく

例えば、大学生の体重が知りたいという疑問があったとします。日本全国の大学生(母集団)の体重を知ることは実質不可能なため、近くの大学で10人(標本)の体重を教えてもらいました。すると、以下のような表のとおりのデータが得られました。

症例

大学生1

大学生2

大学生3

大学生4

大学生5

大学生6

大学生7

大学生8

大学生9

大学生10

体重

50.4

54.6

55.2

58.4

64.3

65.5

69.1

71.4

74.5

88.3

この表からまず分かるのは、「同じデータがない」ということです。これは当たり前かと思いますが、同じデータがないと認識することからバラツキの指標を出力するということを考え出すからです。同じデータがないため、私たちは平均値や中央値という代表値でデータの特徴をつかみ、さらにバラツキの指標を用いることでデータのイメージを膨らますことが出来ます。

 

まとめ
データはばらつくという前提に立ち、同じデータがないということを認識すると、バラツキの指標を確認する必要があることが分かる。
バラツキの指標としては、標準偏差(SD)や四分位範囲がある。
標準偏差は平均値に対応するバラツキの指標、四分位範囲は中央値に対応するバラツキの指標である。



data-ad-client="ca-pub-8866234902868600"
data-ad-slot="5243035170"
data-ad-format="auto">



HOME プロフィール お問い合わせ