注目キーワード
  1. 多重性
  2. 分割表
  3. 分散分析
  4. 検定
  5. 要約

中央値の求め方って?たったの3ステップで求めることができます!

あなたは、中央値の求め方がわからない・・・というような悩みを持っていませんか?

確かに、平均値よりはマイナーな存在。

学校でちゃんと習った記憶もない。

だから、社会人になって悩む人も多いです。

 

ですが、中央値は全く難しくありません!

実は、平均値よりもはるかに簡単。

だって、言葉通り「真ん中の値」が中央値だから。

何もむずかしくないんです。

でも、何の真ん中なんだろう?っていうのがわからなくて、悩んでいる人が多い印象です。

 

このページでは、そんな中央値について。

このページを見れば、このようなことがわかるようになります。

 

  • 中央値の求め方
  • 中央値が必要な場面はどんなとき?
  • 中央値に対応するバラツキの表し方

 

では早速いってみましょう!

 

広告

簡単に算出しよう!中央値の求め方3ステップ

中央値は、3ステップで求めることが可能です。

その3つは、これ。

 

  1. データを小さい順に並べる
  2. データの数が偶数か奇数かを把握する
  3. 真ん中の値を見つける

 

たったこれだけです。

では、例を見ながら一緒に解いてみましょう!

 

例題:あるクラスの、6人の英語の得点は64点、53点、88点、58点、94点、71点だった。この時の中央値を求めなさい。

この問題を、前述の通りの3ステップで中央値を求めてみましょう。

ちなみに、先に正解を記載しておきますね。

 

正解:中央値は67.5点である

 

どうですか?

正解しましたか?

 

ステップ1:データを小さい順に並べる

最初のステップは、データの並べ替え。

左から、英語の点数が悪い順に並べてみましょう。

すると、こんな感じになります。

 

53 58 64 71 88 94

 

ここまでは難しくないですね。

 

ステップ2:データの数が偶数か奇数かを把握する

次は、データの数を把握します。

なぜかというと、偶数か奇数かで、データの真ん中の定義がちょっと違ってくるから。

今回の例だと、例題にすでに6人と記載されているので、偶数であることは明らかですね。

念の為数えてみても、データの数は6個です。

ということで、データの数は偶数であることが確認できました。

 

ステップ3:真ん中の値を見つける

では、最後のステップ。

真ん中の値を見つけること。

じゃあ、今回の6人のデータの真ん中はどこでしょうか?

 

・・・もしかしたら、ここでつまずいたかもしれませんね。

 

なぜなら、今回のデータの数は偶数です。

真ん中ってどこ?

って思いませんでしたか?

3番目のデータ?4番目のデータ?どっち?

って感じです。

 

そう、データの数が偶数の場合には、真ん中の値を一つに決めることができない

そのため、データの数が偶数の場合の中央値は以下の定義になります。

 

データの数が偶数の場合の中央値:「データの真ん中に当たる2つの値の平均値」

 

となるこ、今回の例題の場合、中央値は3番目のデータである64点と、4番目のデータである71点の平均値、ということになります。

なので、(64+71)/2=67.5になるということ。

 

では、データの数が奇数の場合は?というと、これは真ん中の値が1つだけになるため、全く問題なく中央値が求められます。

 

エクセルで実行した結果と比較!

念の為、答え合わせとして、エクセルで中央値がどうなるかを示しておきます。

エクセルの中央値算出の関数はわかりますか?

=median(データの範囲)

ですね。

すると、このような結果になりました。

私たちが計算した中央値と一緒になりましたね。

 

中央値は〇〇に影響を受けないため、すごく便利

中央値の求め方はすごく簡単でした。

では次に考えることは、中央値はどんな場面で使うことができるか?ということです。

 

平均値は「外れ値」にとても影響を受ける性質がありました。

そのため、データが正規分布である時にとても有効な指標です。

詳しくはこちらの3つの記事を参照ください。

代表値について

平均結婚年齢に達したけど、まだ大丈夫?

乱数を用いて、正規分布のグラフをエクセルで描いてみる。たったの3ステップ!

 

じゃあ中央値はどうか?というと、「外れ値に全く影響されない」です。

なので実は、中央値はどんな時にでも使うことができる、とても便利な指標なのです。

 

中央値に対応するバラツキの指標は?

最後は、中央値に対応するバラツキに関して解説します。

その前に、平均値に対応するバラツキの表し方は、大丈夫ですか?

そう、分散や標準偏差ですね。

じゃあ中央値はどうですか?

最初に答えを示すとこうなります。

 

中央値に対応するバラツキは、四分位範囲である。

 

中央値は別名、50%点とも言われます。

全データの中央の値だから、全体の50%の点だ、という意味ですね。

ということは、他にも〇〇%点があって良いと思いませんか?

 

実はあるんです。

有名なのが、25%点と75%点。

25%点は、最小値と中央値の真ん中の値。

75%点は、中央値と最大値の真ん中の値です。

そして、この25%点〜75%点までの範囲を「四分位範囲」と呼びます。

データを四分割した時の範囲、という意味です。

 

黒い丸1つ1つがデータを示しているとして、上の方が大きい値、下の方が小さい値の時。

四分位範囲とは、以下のようになります。

 

この四分位範囲が、中央値に対応するバラツキの表現方法になります。

そのため、中央値を提示する際には、四分位範囲も一緒に提示したいですね。

 

まとめ

中央値は3つのステップで算出可能でした。

  1. データを小さい順に並べる
  2. データの数が偶数か奇数かを把握する
  3. 真ん中の値を見つける

そして、中央値は外れ値の影響を受けないため、どんな場面でも使用可能です。

中央値に対応するバラツキの表現方法は、四分位範囲でした。

統計検定2級の解説付き

無料動画の統計授業

 

 

無料動画で統計を学びませんか?

 

・この数式、何を言っているのか全くわからない・・・ 

・統計を学びたいけど、何から手をつけていいのだろう・・・

・統計検定2級を受験したいけど、どう勉強したら・・・

・もう自力で統計を学ぶのに疲れました・・・

 

あなたはそんな悩みを抱えていませんか?

大丈夫です。

最後の手段があります。

どこにもない、統計の無料メールセミナー。