バラツキの指標

データはばらつく

例えば、大学生の体重が知りたいという疑問があったとします。日本全国の大学生(母集団)の体重を知ることは実質不可能なため、近くの大学で10人(標本)の体重を教えてもらいました。すると、以下のような表のとおりのデータが得られました。

症例

大学生1

大学生2

大学生3

大学生4

大学生5

大学生6

大学生7

大学生8

大学生9

大学生10

体重

50.4

54.6

55.2

58.4

64.3

65.5

69.1

71.4

74.5

88.3

この表からまず分かるのは、「同じデータがない」ということです。これは当たり前かと思いますが、同じデータがないと認識することからバラツキの指標を出力するということを考え出すからです。同じデータがないため、私たちは平均値や中央値という代表値でデータの特徴をつかみ、さらにバラツキの指標を用いることでデータのイメージを膨らますことが出来ます。

 

まとめ
データはばらつくという前提に立ち、同じデータがないということを認識すると、バラツキの指標を確認する必要があることが分かる。
バラツキの指標としては、標準偏差(SD)や四分位範囲がある。
標準偏差は平均値に対応するバラツキの指標、四分位範囲は中央値に対応するバラツキの指標である。

統計は難しい。
これは、私が統計を仕事とする前までに抱いていた幻です。

ですが、実はデータをまとめたり、結果を解釈するだけであれば、それほど難しい知識は不要であることに気付きました。
そして、統計が何をやっているのかを「イメージとしてとらえる」ことが重要であると感じたのです。

こちらのメルマガでは、統計をイメージとしてとらえられるように、動画でまとめました。
今ならメルマガ登録の無料特典として以下の3つの資料を進呈しております。

1.イメージでとらえる統計学
2.イメージでとらえる推定
3.イメージでとらえるP値

ぜひ登録して、イメージを持った統計学への扉を開いてください。
登録はこちらです。

https://maroon-ex.jp/fx46970/oQ2DkN

HOME プロフィール お問い合わせ