統計学的検定における、多重性の問題とは?

テューキー検定とは?T検定や他の多重比較法との違いを解説!

テューキー検定という検定手法をご存知でしょうか?

分散分析とセットでよく登場する検定なのですが、

「テューキー検定って何?」
「T検定と何が違うの?」
「テューキー検定をエクセルでできる?」

といった疑問を抱かれる方もいるのではないかと思います。

そんな方のために本記事ではテューキー検定を解説していきます。

計算式を極力使わずに、なるべく分かりやすく説明していきますね!

 

>>もう統計で悩むのは終わりにしませんか? 

↑1万人以上の医療従事者が購読中

テューキー検定とは?

テューキー検定は多重比較法の一つです。

Tukey法やTukey-Kramer法とよく呼ばれます。

多重比較法の中でもよく使われる方法ですので、分散分析とセットになって頻繁に登場します。

でも多重比較法という言葉を初めて聞いた、または聞いたことはあるけどよく分からない方も多いのではないでしょうか。

まずは多重比較法について説明していきますね。

多重比較法とは

多重比較法とは3群以上のある集団に対して、各群ごとに”多重”に”比較”していく検定方法です。

 

例えばある学校で1〜3組までクラスがあるとしましょう。

このクラスごとにテストの点数に違いがあるか比較していくとします。

この場合、3群を比較するためまずは分散分析で3クラスのどれかに点数が異常に低いまたは高いクラスがあるか検定することを考えがちです。

ただ分散分析だと、有意差が出てもどのクラス間に差があるのかまでは分かりません

何故なら、分散分析の帰無仮説は「全ての群で平均値が同じ」であり、対立仮説は「どこかの群で平均値が異なる」なので、有意差が出たとしても、対立仮説である「どこかの群で平均値が異なる」までしか分からないからです。。

 

せっかくならどのクラスの点数が他クラスと違うのか、そこまで知りたいですよね。

そこで登場するのが多重比較法です。

 

多重比較法は「1組と2組」「2組と3組」「3組と1組」それぞれ点数に差があるか検定にかけることができます。

3群以上の比較では、まず分散分析で有意差があるか確認してから多重比較法で詳細を確認していく方法が一般的です。

 

多重比較法にはいろいろな手法があり、テューキー検定はその中でもよく使われる多重比較法です。

テューキー検定と他の多重比較法との違い

テューキー検定の最大の特徴は、他の多重比較法と比べて検出力が高いということです。

検出力が高いと検定の精度が上がるので、検定をかけるときはなるべく検出力が高い手法を使うのが基本です。

そのため多重比較法の中でテューキー検定は非常によく使われています。

 

ただし、テューキー検定には欠点があります。

テューキー検定は基本的に以下の条件が揃っている場合しか使えません。

  1. 各群の分散が等しい
  2. 各群の分布が正規分布している

 

イメージ的にはパラメトリック検定であるT検定に似ていますね。

 

検定を実施したいデータが上記に当てはまらない場合は、残念ながら違う手法を使わなければなりません。

有名な多重比較法は、他に以下の手法があります。

 

この他にも様々な手法がありますが、正直どれを使えばいいのか迷うことがよくあります。

なので、それぞれの多重比較法のメリットデメリットをしっかり把握していきましょうね!

 

テューキー検定とT検定の違いって?

テューキー検定のp値とT検定のp値は違いがある

T検定とテューキー検定をした時では、同じ群の比較でもp値が変わってきます。

なぜかというと、テューキー検定は複数回の比較を前提にしているためp値の設定が厳しくなっているからです。

なぜ複数回の比較だとp値が厳しくなるのでしょうか?

詳しく説明していきますね。

 

T検定は繰り返し行ってはいけない

T検定は原則として2群を比較する時に使用します

ここまではすでに知ってらっしゃる方も多いかと思います。

ですが、同じ集団に対してT検定を繰り返し何度も使うのも原則NGなのはご存知でしょうか?

 

たとえば、A校と他20の高校で平均身長に差があるか調べたいとしましょう。

この時にA校と他の学校を一つずつ計20回T検定にかけてしまいますが、ここに決定的な落とし穴があります。

p値の水準(有意水準)を5%としていた場合、20回検定をかけると高確率で1回くらいはたまたま有意な差が出てしまうからです。

まさに検定の多重性の問題ですね。

そのためついついやってしまいがちですが、繰り返し検定を実施する時は注意が必要ですし、もし繰り返しの検定を実施するには多重性を回避する方法(調整方法)を考えなければなりません

 

テューキー検定は繰り返しの比較を前提にp値が調整される

では繰り返し検定を実施したい時は、具体的にどうすればいいのでしょうか?

例えば、有意水準を厳しくすれば、繰り返し検定を実施することも可能です。

有名な方法としてボンフェローニ法がありますが、ボンフェローニ法では有意水準を1%にすれば、検定を5回繰り返しても問題ないことになります

ただ毎回繰り返す回数に応じて、いちいち有意水準を計算するのは面倒ですよね。

 

それをすでに調整して、厳しくp値を出すようにしてくれているのがテューキー検定というわけです。

テューキー検定は繰り返し検定を行う数に合わせて、自動で最適なp値を算出できます。

以上の理由から、同じ群の比較でもテューキー検定はT検定よりp値が厳しく出るようになっています。

 

>>もう統計で悩むのは終わりにしませんか? 

↑1万人以上の医療従事者が購読中

テューキー検定をエクセルで実施できる?

エクセルでテューキー検定を実施することは可能です。

ただ少々計算は面倒ですので、今後もテューキー検定を繰り返しされる予定がある方は統計ソフトの使用をおすすめします。

統計ソフトはフリーソフトのEZRがおすすめです。

EZRについてはこちらの記事で詳しく解説していますので、興味があればご覧ください。

「どうしてもエクセルでテューキー検定をかけたい!」

という方に向けて、エクセルでテューキー検定を実施する方法をご紹介します。

 

エクセルでテューキー検定を行う方法

テューキー検定を実施するにあたって、まずは各群の平均値(AVERAGE関数)と全体の分散(VAR.S関数)をそれぞれ算出しておきましょう。

また各群のn数も把握しておきましょう。

ここでは各群のn数が揃っていることを前提とします。(各群でn数が違うと計算量がかなり増えエクセルで行うのは非現実的になります)

まずはこれらの”平均値“、”分散“、”n数“を使って各群を比較したときの”統計量“を算出していきます。

 

A群とB群を比較する場合、統計量の計算方法は以下の通りです。

=ABS(“A群の平均値”-“B群の平均値”)/SQRT(“分散”/”n数”)

 

これを比較する全ての組み合わせで実施します。(1~3組の比較であれば1組×2組、2組×3組、3組×1組)

ABSは値を絶対値にする関数で、SQRTは値に平方根をつける関数です。

 

これでそれぞれの組み合わせ全ての統計量が算出できました。

ではいよいよこれらの統計量が有意な差といえるかどうか、確認していきましょう。

有意水準の表をこちらからご確認ください。

行(縦軸)が自由度、列(横軸)が群の数です。

有意水準が1%か5%か選び、自分のデータに当てはまる数値を確認してみてください。

先ほど算出した統計量がこの数値を超えていれば、”有意差あり”と判定できます。

これでエクセルでテューキー検定をかけることができましたね。

お疲れさまでした。

 

まとめ

最後におさらいをしましょう。

  • テューキー検定は多重比較法の1つで、分散分析とセットで使用する
  • 他の多重比較と比べて検出力は高いが、使用には制限がある
  • テューキー検定はT検定よりp値が高くなるように調整される
  • テューキー検定をエクセルで実施することは可能だが、統計ソフトの使用を推奨する

テューキー検定は多重比較法の中で最も有名な手法の一つで、論文でもよく使われています。

統計初心者の方は、まずはテューキー法の知識をしっかりつけておきましょう。

最後までお読みいただきありがとうございました。

今だけ!いちばんやさしい医療統計の教本を無料で差し上げます

第1章:医学論文の書き方。絶対にやってはいけないことと絶対にやった方がいいこと

第2章:先行研究をレビューし、研究の計画を立てる

第3章:どんな研究をするか決める

第4章:研究ではどんなデータを取得すればいいの?

第5章:取得したデータに最適な解析手法の決め方

第6章:実際に統計解析ソフトで解析する方法

第7章:解析の結果を解釈する

 

もしあなたがこれまでに、何とか統計をマスターしようと散々苦労し、何冊もの統計の本を読み、セミナーに参加してみたのに、それでも統計が苦手なら…

私からプレゼントする内容は、あなたがずっと待ちわびていたものです。

 

↓今すぐ無料で学会発表や論文投稿までに必要な統計を学ぶ↓

↑無料で学会発表や論文投稿に必要な統計を最短で学ぶ↑

COMMENT

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です