統計学的検定を勉強していくと、「片側検定」と「両側検定」という用語に出会います。
あなたはこの「片側検定と両側検定の違い」を説明できますか?
違いを一言でいうと、「興味のある方向が1つだけかそうじゃないか」ということです。
…おそらく、これだけでは何のことかわかりませんね。
今回の記事は、そんな片側検定と両側検定の違いについて。
有意水準や棄却域の設定方法に関しても解説します。
片側検定と両側検定の違いや使い分けは?
片側検定と両側検定の違いに関して、コイン投げを例にして考えてみます。
例えばコインを100回、投げることにします。
その時に、「表が出る回数が極端に多いかどうか」に興味があって、それを検定する場合には片側検定になります。
そうではなく、「表か裏の、どちらかが出る回数が極端に多いかどうか」に興味があったとして、それを検定する場合には両側検定になります。
コイントスの結果は、「表が出る」か「裏が出るか」の2択です。
その時に”表か裏のどちらか一方”の結果だけに興味があれば片側検定。
”表か裏のどっちでもいいから”極端な結果になるかどうかに興味があれば、両側検定です。
片側検定と両側検定の違いをコイントスの例で考えてみる
ちょっとイメージが難しい片側検定と両側検定。
ですが帰無仮説と対立仮説を考えると、実は両者の違いは明確です。
まずは両側検定の場合の帰無仮説と対立仮説を確認してみます。
対立仮説H1:表が出る確率≠裏が出る確率
次に、片側検定の場合の帰無仮説と対立仮説です。
対立仮説H1:表が出る確率>裏が出る確率
つまり、両側検定と片側検定では、帰無仮説は一緒ですが、証明したい対立仮説が異なるということです。
片側検定と両側検定の違いをT検定で考えてみる
では次に、片側検定と両側検定の違いをT検定で考えてみます。
T検定の帰無仮説と対立仮説は何かを見てみましょう。(A群とB群の2標本のT検定の場合)
まずは両側検定の場合の帰無仮説と対立仮説を確認してみます。
対立仮説H1:A群の母平均≠B群の母平均
次に、片側検定(A群の平均値の方が大きいと考える)の場合の帰無仮説と対立仮説です。
A群の母平均=B群の母平均
対立仮説H1:A群の母平均>B群の母平均
先ほどのコイン投げの例と全く同じですね。
両側検定と片側検定では、帰無仮説は一緒ですが、証明したい対立仮説が異なるということです。
ちなみに、B群の平均値の方が大きいと考える場合は、不等号の向きを変えて「A群の母平均<B群の母平均」とすればOKです。
臨床試験では片側検定と両側検定のどっちを使う?どっちに興味がある?
臨床試験で新薬とプラセボを比較する状況での片側検定と両側検定を考えます。
すると、帰無仮説は“新薬の効果はプラセボの効果と同じ”です。
この帰無仮説は、片側検定でも両側検定でも同じですね。
片側検定の場合の対立仮説は、“新薬の効果はプラセボの効果よりも大きい“です。
つまり、数式では“新薬の効果>プラセボの効果”となります。
両側検定の場合の対立仮説は、“新薬の効果はプラセボの効果とは異なる”です。
つまり、数式では“新薬の効果≠プラセボの効果”となります。
臨床試験では、一方にしか興味がないことが多いですね。
一方にしか興味がないというのはつまり、「新薬の効果 > プラセボの効果」ということにしか興味がない場合です。
「新薬の効果 < プラセボの効果」には興味がないですよね。
そのため、臨床試験では全て片側検定でも良いのですが、なぜか慣例的に両側検定を使用しています。
ここには特に理由はありません。
私が担当した試験では片側検定で実施した試験もありますので、両側検定でなければダメだ、ということはありません。
片側検定と両側検定で有意水準や棄却域はどうなるの?
片側検定と両側検定の違いは理解できましたか?
では次に、片側検定と両側検定の違いが、有意水準や棄却域に対してどう関わってくるのかを確認します。
では、その5%を片側検定で使えたら、かなり有利になると思いませんか?
新薬とプラセボの差は、片側にしか興味がない(新薬>プラセボ)ので、全て片側検定にして、有意水準を5%にする。
しかしながら、ICH E9(「臨床試験のための統計的原則」について)では、有意水準を明確に決めています。
つまり、片側検定をする場合には有意水準を2.5%とし、両側検定の場合には5%とすること、が明記されています。
よって片側検定をする場合であっても5%のエラーを許容されていないということです。
そのため、慣例的に臨床試験では両側検定で、有意水準を5%に設定する、ということが行われています。
Rで片側検定と両側検定を実践する!
実際に、サンプルデータを用いて片側検定と両側検定を実施します。
Rをダウンロードした際に含まれている「iris」というデータを使い、対応のないt検定とWilcoxonの順位和検定の2つを用いて実施します。
Rではt.test()関数やwilcox.test()関数の中で、alternative=””を指定することにより、片側検定か両側検定かを指定することができます。
alternative=””を指定しなければ、両側検定を実施します。alternative=””では下記の3つを指定することができます。
- two.sided:両側検定
- less:1つ目に指定した変数が2つ目に指定した変数より小さいという片側検定
- greater:1つ目に指定した変数が2つ目に指定した変数より大きいという片側検定
# データの読み込み
data("iris")
# データの確認
head(iris)
# SetosaとVersicolorのデータ抽出
setosa <- subset(iris, Species == "setosa")
versicolor <- subset(iris, Species == "versicolor")
# 対応のないt検定での両側検定と片側検定
t_test_two <- t.test(setosa$Sepal.Length, versicolor$Sepal.Length, alternative = "two.sided")
t_test_less <- t.test(setosa$Sepal.Length, versicolor$Sepal.Length, alternative = "less")
t_test_greater <- t.test(setosa$Sepal.Length, versicolor$Sepal.Length, alternative = "greater")
print(t_test_two)
print(t_test_less)
print(t_test_greater)
上記のプログラムを実行すると、下記のように結果得られます。(見やすさの観点から、p値のみ記載します。)
alternative=””の指定 | p値 |
two.sided | 2.2e-16 |
less | 2.2e-16 |
greater | 1 |
e-16は、10のマイナス16乗の意味です。そのため「めちゃめちゃ小さいp値である」ということがわかります。
次に、ウィルコクソンの順位和検定で両側検定と片側検定を実施します。
# ウィルコクソンの順位和検定での両側検定と片側検定
wilcox_test_two <- wilcox.test(setosa$Sepal.Length, versicolor$Sepal.Length, alternative = "two.sided")
wilcox_test_less <- wilcox.test(setosa$Sepal.Length, versicolor$Sepal.Length, alternative = "less")
wilcox_test_greater <- wilcox.test(setosa$Sepal.Length, versicolor$Sepal.Length, alternative = "greater")
print(wilcox_test_two)
print(wilcox_test_less)
print(wilcox_test_greater)
alternative=””の指定 | p値 |
two.sided | 8.346e-14 |
less | 4.173e-14 |
greater | 1 |
片側検定と両側検定の違いや使い分けまとめ
片側検定と両側検定の違いは「どちらに興味があるのか」という違いでした。
臨床試験では「新薬の効果>プラセボの効果」にしか興味がないため、片側検定でも成り立ちます。
ですが、慣例的には両側検定で5%の有意水準を設定して試験を実施する事が多いです。
コメント
コメント一覧 (2件)
[…] […]
[…] という帰無仮説、対立仮説のもと、片側検定を行うことになります。 […]