統計学的検定を勉強していくと、「片側検定」と「両側検定」という用語に出会います。
あなたはこの「片側検定と両側検定の違い」を説明できますか?
違いを一言でいうと、「興味のある方向が1つだけかそうじゃないか」ということです。
…おそらく、これだけでは何のことかわかりませんね。
今回の記事は、そんな片側検定と両側検定の違いについて。
有意水準や棄却域の設定方法に関しても解説します。
Contents
片側検定と両側検定の違いや使い分けは?
片側検定と両側検定の違いに関して、コイン投げを例にして考えてみます。
例えばコインを100回、投げることにします。
その時に、「表が出る回数が極端に多いかどうか」に興味があって、それを検定する場合には片側検定になります。
そうではなく、「表か裏の、どちらかが出る回数が極端に多いかどうか」に興味があったとして、それを検定する場合には両側検定になります。
コイントスの結果は、「表が出る」か「裏が出るか」の2択です。
その時に”表か裏のどちらか一方”の結果だけに興味があれば片側検定。
”表か裏のどっちでもいいから”極端な結果になるかどうかに興味があれば、両側検定です。
片側検定と両側検定の違いをコイントスの例で考えてみる
ちょっとイメージが難しい片側検定と両側検定。
ですが帰無仮説と対立仮説を考えると、実は両者の違いは明確です。
まずは両側検定の場合の帰無仮説と対立仮説を確認してみます。
帰無仮説H0:表が出る確率=裏が出る確率
対立仮説H1:表が出る確率≠裏が出る確率
次に、片側検定の場合の帰無仮説と対立仮説です。
帰無仮説H0:表が出る確率=裏が出る確率
対立仮説H1:表が出る確率>裏が出る確率
つまり、両側検定と片側検定では、帰無仮説は一緒ですが、証明したい対立仮説が異なるということです。
片側検定と両側検定の違いをT検定で考えてみる
では次に、片側検定と両側検定の違いをT検定で考えてみます。
T検定の帰無仮説と対立仮説は何かを見てみましょう。(A群とB群の2標本のT検定の場合)
まずは両側検定の場合の帰無仮説と対立仮説を確認してみます。
帰無仮説H0:A群の母平均=B群の母平均
対立仮説H1:A群の母平均≠B群の母平均
次に、片側検定(A群の平均値の方が大きいと考える)の場合の帰無仮説と対立仮説です。
帰無仮説H0:
A群の母平均=B群の母平均
対立仮説H1:A群の母平均>B群の母平均
先ほどのコイン投げの例と全く同じですね。
両側検定と片側検定では、帰無仮説は一緒ですが、証明したい対立仮説が異なるということです。
ちなみに、B群の平均値の方が大きいと考える場合は、不等号の向きを変えて「A群の母平均<B群の母平均」とすればOKです。
臨床試験では片側検定と両側検定のどっちを使う?どっちに興味がある?
臨床試験で新薬とプラセボを比較する状況での片側検定と両側検定を考えます。
すると、帰無仮説は“新薬の効果はプラセボの効果と同じ”です。
この帰無仮説は、片側検定でも両側検定でも同じですね。
片側検定の場合の対立仮説は、“新薬の効果はプラセボの効果よりも大きい“です。
つまり、数式では“新薬の効果>プラセボの効果”となります。
両側検定の場合の対立仮説は、“新薬の効果はプラセボの効果とは異なる”です。
つまり、数式では“新薬の効果≠プラセボの効果”となります。
臨床試験では、一方にしか興味がないことが多いですね。
一方にしか興味がないというのはつまり、「新薬の効果 > プラセボの効果」ということにしか興味がない場合です。
「新薬の効果 < プラセボの効果」には興味がないですよね。
そのため、臨床試験では全て片側検定でも良いのですが、なぜか慣例的に両側検定を使用しています。
ここには特に理由はありません。
私が担当した試験では片側検定で実施した試験もありますので、両側検定でなければダメだ、ということはありません。
片側検定と両側検定で有意水準や棄却域はどうなるの?
片側検定と両側検定の違いは理解できましたか?
では次に、片側検定と両側検定の違いが、有意水準や棄却域に対してどう関わってくるのかを確認します。
では、その5%を片側検定で使えたら、かなり有利になると思いませんか?
新薬とプラセボの差は、片側にしか興味がない(新薬>プラセボ)ので、全て片側検定にして、有意水準を5%にする。
しかしながら、ICH E9(「臨床試験のための統計的原則」について)では、有意水準を明確に決めています。
つまり、片側検定をする場合には有意水準を2.5%とし、両側検定の場合には5%とすること、が明記されています。
よって片側検定をする場合であっても5%のエラーを許容されていないということです。
そのため、慣例的に臨床試験では両側検定で、有意水準を5%に設定する、ということが行われています。
片側検定と両側検定の違いや使い分けまとめ
片側検定と両側検定の違いは「どちらに興味があるのか」という違いでした。
臨床試験では「新薬の効果>プラセボの効果」にしか興味がないため、片側検定でも成り立ちます。
ですが、慣例的には両側検定で5%の有意水準を設定して試験を実施する事が多いです。
第1章:臨床研究ではなぜ統計が必要なのか?計画することの重要性
第2章:研究目的をどれだけ明確にできるのかが重要
第3章:p値で結果が左右される時代は終わりました
第4章:多くの人が統計を苦手にする理由
第5章:統計を使えるようになるために今日から何をすれば良いか?
第6章:統計を学ぶために重要な環境
もしあなたがこれまでに、何とか統計をマスターしようと散々苦労し、何冊もの統計の本を読み、セミナーに参加してみたのに、それでも統計が苦手なら…
私からプレゼントする内容は、あなたがずっと待ちわびていたものです。