Oops! It appears that you have disabled your Javascript. In order for you to see this page as it is meant to appear, we ask that you please re-enable your Javascript!
統計学的検定の基礎

片側検定と両側検定の違いとは?有意水準や棄却域はどう設定するか?

統計学的検定を勉強していくと、「片側検定」と「両側検定」という用語に出会います。

あなたはこの「片側検定と両側検定の違い」を説明できますか?

違いを一言でいうと、「興味のある方向が1つだけかそうじゃないか」ということです。

…おそらく、これだけでは何のことかわかりませんね。

今回の記事は、そんな片側検定と両側検定の違いについて。

有意水準や棄却域の設定方法に関しても解説します。

 

 

片側検定と両側検定の違いとは?

片側検定と両側検定の違いに関して、コイン投げを例にして考えてみます。

例えばコインを100回、投げることにします。

その時に、「表が出る回数が極端に多いかどうか」に興味があって、それを検定する場合には片側検定になります。

そうではなく、「表か裏の、どちらかが出る回数が極端に多いかどうか」に興味があったとして、それを検定する場合には両側検定になります。

 

コイントスの結果は、「表が出る」か「裏が出るか」の2択です。

その時に”表か裏のどちらか一方”の結果だけに興味があれば片側検定。

”表か裏のどっちでもいいから”極端な結果になるかどうかに興味があれば、両側検定です。

 

 

スポンサーリンク

コイントスの例での帰無仮説と対立仮説を考えてみる

ちょっとイメージが難しい片側検定と両側検定。

ですが帰無仮説と対立仮説を考えると、実は両者の違いは明確です。

 

まずは両側検定の場合の帰無仮説と対立仮説を確認してみます。

両側検定の場合の帰無仮説と対立仮説

帰無仮説H0:表が出る確率=裏が出る確率

対立仮説H1:表が出る確率裏が出る確率

 

次に、片側検定の場合の帰無仮説と対立仮説です。

片側検定の場合の帰無仮説と対立仮説

帰無仮説H0:表が出る確率=裏が出る確率

対立仮説H1:表が出る確率裏が出る確率

 

つまり、両側検定と片側検定では、帰無仮説は一緒ですが、証明したい対立仮説が異なるということです。

 

臨床試験ではどっちに興味がある?

臨床試験で新薬とプラセボを比較する状況での片側検定と両側検定を考えます。

すると、帰無仮説は“新薬の効果はプラセボの効果と同じ”です。

この帰無仮説は、片側検定でも両側検定でも同じですね。

 

片側検定の場合の対立仮説は、“新薬の効果はプラセボの効果よりも大きい“です。

つまり、数式では“新薬の効果>プラセボの効果”となります。

 

両側検定の場合の対立仮説は、“新薬の効果はプラセボの効果とは異なる”です。

つまり、数式では“新薬の効果≠プラセボの効果”となります。

 

臨床試験では、一方にしか興味がないことが多いですね。

一方にしか興味がないというのはつまり、「新薬の効果 > プラセボの効果」ということにしか興味がない場合です。

「新薬の効果 < プラセボの効果」には興味がないですよね。

そのため、臨床試験では全て片側検定でも良いのですが、なぜか慣例的に両側検定を使用しています。

ここには特に理由はありません。

私が担当した試験では片側検定で実施した試験もありますので、両側検定でなければダメだ、ということはありません。

 

スポンサーリンク

片側検定と両側検定で有意水準や棄却域はどうなる?

片側検定と両側検定の違いは理解できましたか?

では次に、片側検定と両側検定の違いが、有意水準や棄却域に対してどう関わってくるのかを確認します。

 

αエラー(第1種の過誤)は5%と明確に定められています

では、その5%を片側検定で使えたら、かなり有利になると思いませんか?

新薬とプラセボの差は、片側にしか興味がない(新薬>プラセボ)ので、全て片側検定にして、有意水準を5%にする。

 

しかしながら、ICH E9(「臨床試験のための統計的原則」について)では、有意水準を明確に決めています。

つまり、片側検定をする場合には有意水準を2.5%とし、両側検定の場合には5%とすること、が明記されています。

よって片側検定をする場合であっても5%のエラーを許容されていないということです。

そのため、慣例的に臨床試験では両側検定で、有意水準を5%に設定する、ということが行われています

 

まとめ

片側検定と両側検定の違いは「どちらに興味があるのか」という違いでした。

臨床試験では「新薬の効果>プラセボの効果」にしか興味がないため、片側検定でも成り立ちます。

ですが、慣例的には両側検定で5%の有意水準を設定して試験を実施する事が多いです。

 

論文化に必要な統計に絞った地図あります

 

  • パソコンに向かってもなぜか筆が進まない…
  • 学会発表は結構たくさんしているのに、なぜ論文が出ないのだろう…
  • こんなに忙しいのに、いつ論文を書いたらいいのか…
  • 一度は書いたはずの論文がお蔵入りに…どうすればいいの…
  • データはあるのになぜ論文化まで持っていけないんだろう…
  • このデータ、どうやって解析すればいいんだろう…

 

その悩みこの無料メルマガで全て解決するかもしれません

 

↓今すぐ無料で論文化までの最短距離を歩く↓

↑無料で論文化に必要な統計を最短で学ぶ↑