平均値と中央値の特徴

具体例を用いて、平均値と中央値の特徴をまとめてみたいと思います。

 

5人の小学生がいて、あるテストの点数が 30 点、40 点、50 点、60 点、70 点だったとき、平均値はどうなりますか?「(30+40+50+60+70)÷5=50 点」となります。一方、中央値は今回はデータが5つありますので、真ん中(3 つ目)の値である 50 点となります。このケースは平均値と中央値が同じになりました。
では、次の場合はどうでしょう。同じく5人の小学生のテストの点数が 30 点、35 点、40 点、40 点、90 点だったとき、平均値は
「(30+35+40+40+90)÷5=47 点」となり、90 点以外の4人は平均値以下となります。中央値は、真ん中の値ですので 40 点となります。
このように、平均値の場合は他の値と比べて極端に高い(もしくは低い)値があることによって、影響を受けてしまいます。中央値の場合は、真ん中の値ですので、そのような影響は受けません。
このような特徴のある平均値と中央値ですが、どちらを用いることが良いか?ということが疑問になると思います。一般的には、どちらも算出するということが大事です。平均値と中央値を算出してみて、その二つがあまりにもかけ離れていた場合には、データ変換や統計手法の変更などを検討する材料になるからです。

 

色々な平均値

平均値といえば算術平均をイメージする方が大半だと思いますが、実は平均値にも様々な種類があります。

  • 算術平均:上記で記載した平均値です。
  • 幾何平均:全てのデータの値を掛け合わせて、データ数の累乗根を求めた値です。
  • 調和平均:逆数の算術平均の逆数です。詳しくはWilipediaなどをご覧ください。

この中で、医薬品開発によく使われる平均値は、算術平均と幾何平均です。調和平均は見たことがありません。幾何平均は、以下の図のように、分布が右裾を引いている場合に有効です。このような分布のことを対数正規分布と呼び、これはデータを対数変換することで正規分布に近づくという性質があります。そして、幾何平均とは、対数変換後のデータにおける算術平均と同じ意味です。例えば臨床検査値や薬物動態は対数正規分布に従うことが経験的に分かっているため、臨床試験において幾何平均が良く使われます。

 

まとめ

平均値は外れ値に影響を受けやすいが、中央値は影響が少ない。また、臨床試験では算術平均と幾何平均が良く用いられる。
平均値と中央値は、両方算出するのが良い。



data-ad-client="ca-pub-8866234902868600"
data-ad-slot="5243035170"
data-ad-format="auto">



HOME プロフィール お問い合わせ