統計学的検定とはわかりやすく一言でいうと何?
こんな質問をされた時に、あなたはどのように回答するでしょうか?
統計的検定とは、”ある結論を得るための手段”です。
この記事では、統計学的検定の概要をわかりやすく簡単にお伝えしますね。
統計的検定に付随する各種「検定統計量」というのもよくわからなかったりしますよね。。
ざっくりと簡単にわかりやすく、検定統計量もお伝えしていきます!
統計学的検定とはわかりやすく言うと?
世の中には検定と呼ばれるものが数多くあります。
英語検定、数学検定、アロマテラピー検定など。
とてもユニークなものとしては、伊賀忍者検定なんていうのもあるそうですね。
ロゴ、めちゃめちゃかっこいいですね!
実は、世の中にある全ての検定には、共通点があります。
それは「合格 / 不合格」という結論が出るということ。
そんなの当たり前じゃないか!
と思う方が多いと思いますが、統計学的検定を考える上でも、実はこの「合格 / 不合格」という概念が重要。
なぜか、統計学的検定となると、この概念が抜け落ちる人が多いです。
あなたもそんな一人になっていませんか?
統計学的検定も”ある結論を得る”というがいねんが重要なのです。
統計学的検定とは、統計的に有意かどうかを決めること
統計学的検定とは、”ある結論を得るための手段”です。
ではこの”ある結論”とは何でしょうか?
おそらく、あなたは何となく想像ついているでしょう。
そう、統計学的検定とは「有意差あり / 有意差なし」という結論を得るための手法です。
この結論以外にはあり得ないんです。
絶対に2択です。
それ以外の表現で検定結果を表現していると、あんまり統計のことがわかってないんだな、って思います。
例えば、P値<0.01の結果が出た時。
「非常に有意」っていう結論を出している学会発表とかないですか?
私はすごく見かけます。
そんな学会を見かけると、こんな気持ちです。
そんな結論は、実は有り得ないんです。
もう一度言いますね。
統計学的検定とは、「有意差あり / 有意差なし」という結論を得るための手法。
同じ作用機序の薬剤AとBがあったとして。
Aの薬剤の第III相試験(プラセボ比較)結果はP=0.045
Bの薬剤の第III相試験(プラセボ比較)結果はP=0.001
この時、Bの方がよく効く薬だといえますか?
絶対に言えないですからね!!
なぜなら、サンプルサイズが大きくなるとP値は小さくなる性質があるからです。
つまり、Bの方が効果に差があったのか、それともサンプルサイズが多かったからなのかが、検定の結果だけではわからないのです。
統計学的検定を行う意義とは。P値を出すことではない
あなたももしかしたら「統計学的検定を実施する事=P値を出すこと」という理解をされているかもしれないですね。
ですがこれは、決定的な間違いです。
確かに検定でP値は必要。
だけど、P値は結論を得るための一つのツールです。
有意水準とP値があって初めて、有意差があるかどうかが決まります。
繰り返しになりますが、統計学的検定で大事なのは「有意差あり / 有意差なし」という結論です。
他のページで説明しますが、P値はあくまで確率を表しているものです。
一方で検定は、結論を得るための手法です。
まずは統計学的検定の手順を知ることが重要
検定は「有意差あり / 有意差なし」という結論を得るための手法であることを繰り返し述べました。
そのため、検定をするうえで重要なこと。
実は、どういった手順で検定を実施するかという、概念を知ることが一番重要です。
なぜなら統計学的検定は「仮説検定」と呼ばれている通り、帰無仮説と対立仮説を先に決めなければなりません。
多くの書籍が「どの検定を使えばよいか?」「どうやったらP値を出せるか?」ということが重視されすぎていますが、実はそれよりもちゃんと統計学的検定の手順を知ることの方が重要。
それがわかれば、たとえT検定であろうと、ウィルコクソン検定であろうと、分散分析であろうと、ログランク検定であろうと、すべて同じ枠組みで考えることができるからです。
統計学的検定の種類の違いは、データがどんな種類なのか?ということだけです。
- 統計学的検定の枠組み
- データの種類
この二つさえわかっていれば、検定は自ずと理解できます。
検定統計量とはわかりやすくいうと何?
そして、統計的検定を学んでいると必ず出てくる用語が「検定統計量」です。
検定統計量って言われても、結局なんなの・・・??と思ってしまいますよね。
代表的な検定統計量を挙げると、以下のような統計量があります。
- T統計量
- F統計量
- カイ二乗統計量
- Z統計量
などなど。。
これらを見ただけでも逃げ出したくなりそう。。
と思ってしまいますが、検定統計量はそれほど難しいものではありません。
というのも、統計的検定は以下のような流れで実施されるからです。
そのため検定統計量とは「最終的なP値を算出するためにデータから一度変換しなければならない値」ぐらいにイメージしていただければOKです。
それ以上でも、それ以下でもないです!
ちなみに、検定統計量が大きくなればP値は小さくなり、検定統計量が小さくなればP値は大きくなる、という性質があります!
統計学的検定に関するまとめ
- 世の中にある全ての検定には、「合格 / 不合格」という結果が出るということで共通。
- 統計学的検定も「有意差あり / 有意差なし」という結論を得るという点で同じである。
- 統計学的検定とP値の算出は全く違うことである。
- 統計学的検定を実施するうえで重要なのは、その手順であり、概念である。
コメント
コメント一覧 (2件)
[…] 統計学的検定は「有意差あり / 有意差なし」を判定するための手法ですよね。 […]
[…] でも、よく理解してもいない統計学的検定をやってみてP値が0.05を下回るかどうかで一喜一憂するよりも、要約統計量を出力してちゃんとデータと向き合うほうが、とても重要なのです。 […]