代表的な要約統計量の整理

代表値

代表値とは、平均値や中央値などのように、データの特徴を表す統計量です。それぞれの特徴は、また別のページで解説します。

  • 算術平均:算術平均とは、世間でいう平均値のことで、全ての個別データを足しあげて、その合計をデータの個数で割り算した値のことを言います。
  •   例:クラス全員の身長を足しあげて、人数で割った数値

  • 中央値:データを大きさの順に並べて、ちょうど真ん中にくる値のことを言います。
  •   例:生徒を背の低い順に並ばせ、ちょうど真ん中の生徒の身長

  • 最頻値:対象者がもっとも集中しているデータ値のことを言います。
  •   例:生徒の身長を5センチメートル刻みで分割し、1番たくさんの生徒が入った範囲

 

バラツキの指標

データはばらつきます。その前提に立つと、どれぐらいばらついているのか?ということに興味が出てくるでしょう。その場合には、以下のようなバラツキの指標を算出する必要があります。こちらも詳細には別ページで解説します。

  • 分散:各データが平均値からどれぐらい離れているか?を知るための指標。
  • 標準偏差:分散の平方根を取ったもの。
  • 四分位範囲:データの25%点と75%点の範囲。(50%点が中央値)
  • 範囲(Range):最小値と最大値の範囲。

この説明を見ると、分散と標準偏差は平均値に対応したバラツキの指標、四分位範囲と範囲は中央値に対応したバラツキの指標であることが分かります。そのため例えば、中央値を代表値として示しているのに、分散が示されている場合には、「センスがない」ということです。

 

まとめ

要約統計量は、代表値とバラツキの指標の2つがセットで示される必要がある。また、分散と標準偏差は平均値に対応したバラツキの指標、四分位範囲と範囲は中央値に対応したバラツキの指標であることを理解する必要がある。

統計は難しい。
これは、私が統計を仕事とする前までに抱いていた幻です。

ですが、実はデータをまとめたり、結果を解釈するだけであれば、それほど難しい知識は不要であることに気付きました。
そして、統計が何をやっているのかを「イメージとしてとらえる」ことが重要であると感じたのです。

こちらのメルマガでは、統計をイメージとしてとらえられるように、動画でまとめました。
今ならメルマガ登録の無料特典として以下の3つの資料を進呈しております。

1.イメージでとらえる統計学
2.イメージでとらえる推定
3.イメージでとらえるP値

ぜひ登録して、イメージを持った統計学への扉を開いてください。
登録はこちらです。

https://maroon-ex.jp/fx46970/oQ2DkN

HOME プロフィール お問い合わせ