データの要約記事一覧

データを要約するということ

データをまとめる力データが得られたら、何をする必要があるでしょうか?一つ一つのデータを確認する?平均値を出してみる?検定してみる?実は、どれも正解です。臨床試験のデータであれば、第I相試験ぐらいのデータ量であれば一つ一つ確認することも可能ですし、むしろそれがとても重要な場面が多々あります。しかし、第...

≫続きを読む

代表的な要約統計量の整理

代表値代表値とは、平均値や中央値などのように、データの特徴を表す統計量です。それぞれの特徴は、また別のページで解説します。算術平均:算術平均とは、世間でいう平均値のことで、全ての個別データを足しあげて、その合計をデータの個数で割り算した値のことを言います。  例:クラス全員の身長を足しあげて、人数で...

≫続きを読む

代表値について

平均値と中央値の特徴具体例を用いて、平均値と中央値の特徴をまとめてみたいと思います。5人の小学生がいて、あるテストの点数が 30 点、40 点、50 点、60 点、70 点だったとき、平均値はどうなりますか?「(30+40+50+60+70)÷5=50 点」となります。一方、中央値は今回はデータが5...

≫続きを読む

バラツキの指標

データはばらつく例えば、大学生の体重が知りたいという疑問があったとします。日本全国の大学生(母集団)の体重を知ることは実質不可能なため、近くの大学で10人(標本)の体重を教えてもらいました。すると、以下のような表のとおりのデータが得られました。症例大学生1大学生2大学生3大学生4大学生5大学生6大学...

≫続きを読む

95%信頼区間について

点と線私たちは代表値とバラつきに関して理解しました。しかしこれではまだ不十分です。それは,代表値が「点」推定であるということです。どういうことかを,バラつきの指標のページで登場した,大学生の体重の例を使ってみましょう。10人(母集団)のうちの5人(標本)の平均値は?この表にある,10人のデータが母集...

≫続きを読む

外れ値について

外れ値って?外れ値の定義は実は難しいです。直感的には,見た目で「このデータ,他のデータからすごく離れたところにあるな」と思うようなデータは外れ値になるのだと思います。ただ,明確な閾値がないのが現実です。例えば,平均値から3SDより離れたところにあるデータは外れ値とする,などといった定義を作ることは可...

≫続きを読む

平均値と中央値が違う場合

平均値が一番効力を持つ場面「データを要約する」といった場合に,ほとんど全ての人はまず,平均値を出力することから始めると思います。ですが,平均値がその効力を発揮する場面というのは,「データの分布が左右対称」である場合です。例えば,身長のデータは左右対称な分布(正規分布)に従うことが知られています。この...

≫続きを読む

変数変換

変数変換をする目的変数変換という言葉を、もしかしたら聞いたことがあるかもしれません。ですが、変数変換の目的を理解している人は少ないのではないでしょうか?平均値と中央値が違う場合、の記事にも少し記載しましたが、統計学の中で変数変換をする目的は、パラメトリックな解析をするためにあります。つまり、データの...

≫続きを読む


HOME プロフィール お問い合わせ