ダネット検定という検定手法をご存知でしょうか?
すごく有名な手法ではないので、あまり検定手法に馴染みがない方だと
- 「ダネット検定って何?」
- 「T検定と何が違うの?」
- 「ダネット検定をエクセルでできる?」
といった疑問を抱かれるのではないかと思います。
そんな方のために本記事ではダネット検定を解説していきます。
計算式を使わずに、なるべく分かりやすく説明していきますね!
ダネット検定とは?
ダネット検定は多重比較法の一つです。
たいていは分散分析とセットになって登場します。
でも「多重比較法って何?」となる方も多いのではないでしょうか。
まずは、ダネット検定を理解する上で重要な多重比較法について説明していきますね。
そもそも多重比較法とはなに?
多重比較法とは3群以上のある集団に対して、各群ごとに”多重”に”比較”していく検定方法です。
例えばある学校で1〜3組までクラスがあるとしましょう。
このクラスごとにテストの点数に違いがあるか比較していくとします。
この場合、3群を比較するためまずは分散分析で3クラスのどれかに点数が異常に低いまたは高いクラスがあるか検定することを考えがちです。
ただ分散分析だと、有意差が出てもどのクラス間に差があるのかまでは分かりません。
何故なら、分散分析の帰無仮説は「全ての群で平均値が同じ」であり、対立仮説は「どこかの群で平均値が異なる」なので、有意差が出たとしても、対立仮説である「どこかの群で平均値が異なる」までしか分からないからです。。
せっかくならどのクラスの点数が他クラスと違うのか、そこまで知りたいですよね。
そこで登場するのが多重比較法です。
多重比較法は「1組と2組」「2組と3組」「3組と1組」それぞれ点数に差があるか検定にかけることができます。
3群以上の比較では、まず分散分析で有意差があるか確認してから多重比較法で詳細を確認していく方法が一般的です。
多重比較法についてイメージができましたか?
多重比較法にはいろいろな手法があり、ダネット検定はその中の1つ、というわけです。
ダネット検定と他の多重比較法との違い
多重比較について理解できると、今度は
「ダネット検定は他の多重比較法と何が違うの?」
といった疑問が出てきますよね。
ダネット検定は他の多重比較法と決定的に違うことがあります。
ダネット検定はある1群(通常はコントロール群)とその他の群の差だけを検定する
先ほどの例を使って説明していきましょう。
通常の多重比較なら、「1組と2組」「2組と3組」「3組と1組」の3通りの組み合わせを比較します。
しかしダネット検定の場合は違います。
例えば1組をコントロール群としてダネット検定を行うと、1組×2組と1組×3組の2通りしか比較しません。
この比較は「1組が他のクラスより点数が違うかどうかだけ知りたい」という場合に役立ちます。
もちろんコントロール群は1組以外のどの組でも構いません。
このように、ある一つの群(コントロール群)と他の群を比較するのがダネット検定の最大の特徴です。
ちなみに全ての組み合わせを比較したい場合には、テューキー検定という手法が有名です。
テューキー検定についてはをご覧ください。
ダネット検定とT検定の違いって?
ダネット検定に関して、なんとなく分かったかと思います。
ではダネット検定をさらに深く考える上で、最もメジャーな検定の一つであるT検定と比較してみましょう。
ダネット検定のp値とT検定のp値は違いがある
T検定とダネット検定をした時では、同じ群の比較でもp値が変わってきます。
なぜかというと、ダネット検定は複数回の比較を前提にしているためp値の設定が厳しくなっているからです。
なぜ複数回の比較だとp値が厳しくなるのでしょうか?
詳しく説明していきますね。
T検定は繰り返し行ってはいけない
ここまではすでに知ってらっしゃる方も多いかと思います。
ですが、同じ集団に対してT検定を繰り返し何度も使うのも原則NGなのはご存知でしょうか?
たとえば、A校と他20の高校で平均身長に差があるか調べたいとしましょう。
この時にA校と他の学校を一つずつ計20回T検定にかけてしまいますが、ここに決定的な落とし穴があります。
p値の水準(有意水準)を5%としていた場合、20回検定をかけると高確率で1回くらいはたまたま有意な差が出てしまうからです。
まさに検定の多重性の問題ですね。
そのためついついやってしまいがちですが、繰り返し検定を実施する時は注意が必要ですし、もし繰り返しの検定を実施するには多重性を回避する方法(調整方法)を考えなければなりません。
ダネット検定は繰り返しの比較を前提にp値が調整される
では繰り返し検定を実施したい時は、具体的にどうすればいいのでしょうか?
例えば、有意水準を厳しくすれば、繰り返し検定を実施することも可能です。
有名な方法としてボンフェローニ法がありますが、ボンフェローニ法では有意水準を1%にすれば、検定を5回繰り返しても問題ないことになります。
ただ毎回繰り返す回数に応じて、いちいち有意水準を計算するのは面倒ですよね。
そのため、検定をする際に多重性を調整し、厳しくp値を出すようにしてくれているのがダネット検定というわけです。
ダネット検定は繰り返し検定を行う数に合わせて、自動で最適なp値を算出できます。
以上の理由から、同じ群の比較でもダネット検定はT検定よりp値が厳しく出るようになっています。
ダネット検定をエクセルで実施できる?
エクセルでダネット検定は実施できる?
ダネット検定はエクセルで実施できるのか、気になりますよね。
結論から言うと、頑張ればエクセルでも実施できます。
ただし有意水準を下回ってるかどうかの大体の判断はできますが、p値は出せません。
それに、かなり作業が面倒です。
もしエクセルを絶対に使う必要がないのであれば、ぜひEZRというフリー統計ソフトを試してみてください!
こちらの記事にEZRを使って分散分析の方法を紹介しています。(分散分析の際にダネット検定という項目を選択すれば、ダネット検定も出来ます)
エクセルに比べて圧倒的に楽な上に、p値も出ますのでオススメです!
エクセルでダネット検定を行う方法
どうしてもエクセルを使う必要がある方に向けて、エクセルでダネット検定を行う方法を紹介します。
まず事前に計算して出しておく必要があるのは、以下の項目です。
それぞれの群で算出しておきましょう。
- N数
- 平均
- 分散(VAR関数を使用)
ここまでは大丈夫ですか?
ここからが本番です。
次に”誤差自由度“と”誤差分散“を算出しなければなりません。
用語の意味を必ず覚える必要はないので、ひとまずそういうものを算出しなきゃいけないんだと思っておいて下さいね。
誤差自由度は”(全てのN数)-(全ての群の数)”で算出して下さい。
誤差分散 は各群で”(N数-1)×(その群の分散)”を行い、それら全てを足し合わせたものです。
どちらも計算式自体はそこまで複雑じゃないですよね。
では最後、”統計量“を算出しましょう。
ここではコントロール群と比較する群の2つの群を使っていきます。
統計量はエクセルの数式で示すとこのようになります。
=((コントロール群の平均)-(比較群の平均))/SQRT((誤差分散)*(1/(コントロール群のN数)+1/(比較群のN数)))
ざっくり言うと、コントロール群と比較群の平均値差を、いろいろ調整した誤差分散で割っています。
これでようやく統計量が出ましたので、次が最後です。
統計量の絶対値がダネットの表の値より大きければ、有意差ありと判定できます。
ダネットの表はこちらで確認できます。
片側検定と両側検定がありますが、よく分からない方はひとまず両側検定を使用したほうがいいですよ!
後はn数と群数で数値がみれますので、それを統計量と比べてみてください。
以上がエクセルでダネット検定を行う方法です。
お疲れさまでした。
※ただしこの方法はあくまで近似的にダネット検定をかけられるだけで、正確ではありませんのでご注意下さい。
まとめ
最後におさらいをしましょう。
- ダネット検定は多重比較法の一種
- ダネット検定はある群と他の群だけを比較することが特徴
- ダネット検定のp値はT検定より少し厳しく出る
- 検定をかける際はEZRの使用を推奨
いかがでしょうか?
ダネット検定についての疑問が解消できていれば幸いです。
ある群と他の複数群を比較する時にはしばしば使用することになる検定ですので、是非覚えておきましょう!
最後までお読み頂きありがとうございました。
コメント