バートレット検定という統計手法はご存知でしょうか?
分散分析などの検定手法に比べて目立たない検定なので知らない方も多いかもしれません。
ですが論文などでバートレット検定が出てくる場合もありますので、結果を理解する上では知っておいて損はないでしょう。
本記事では、なるべく分かりやすくバートレット検定について解説していきますね!
バートレット検定とは?
バートレット検定は各群の分散が等しいかどうか確かめる検定です。
そのためバートレット検定のことを”等分散性の検定”と呼ぶこともあります。
バートレット検定の結果、p値が有意水準を下回った場合に“比較した群の分散は等しくない”という判断をします。
ある検定を実施する上では分散が等しい方が望ましい検定もあるため、p値が有意水準より高く出る方が良いことが多く、通常の検定と結果の見方が逆になるので注意して下さい。
またバートレットは各群の分布が正規分布している時にしか使えません。
正規分布していない場合はルビーン検定という検定手法を使うようにしましょう。
以上がバートレット検定の概要ですが、まだまだ説明不足な点も多いので、一つ一つ詳しく説明していきましょう。
バートレット検定が確かめている分散とは?
「そもそも分散って何?」
となった方もいると思うので、分散とは何か解説していきましょう。
分散を一言で表すと、”データのばらつき”です。
分散が小さいと全てのデータが平均値付近にあり、分散が大きいと平均値から離れたデータが多いということです。
計算方法を言葉で表すと、”各データの値から全体の平均を引いたものを2乗し、全て足し合わせた後にn数で割ったもの”となります。
分散についてはこちらで解説していますので、もっと詳しく知りたい方はご覧ください。
なぜバートレット検定が必要なのか?
「どうして分散が等しいかどうか確かめる必要があるの?」
と疑問に思われた方も多いかもしれません。
でも分散が等しいか確かめることは非常に大事なのです。
なぜなら分散が等しくない場合、一部の検定を使うことが出来なくなってしまうからです。
- StudentのT検定
- 分散分析
- テューキー検定
今挙げた検定はいずれも有名ですが、これらは全て各群の分散が等しいことを前提としているパラメトリック検定なのです。
つまりこれから分散分析やテューキー検定を使う予定がある場合、事前にバートレット検定を検討することがあります(T検定の場合は後述するF検定を検討します)。
これがバートレット検定が必要な理由です。
ただし、どの検定を使うか判断するために検定を実施することは、多重性の問題や標本データに依存しすぎた判断になるため、あまり推奨しません。
そのため、各群のヒストグラムや箱ひげ図などを作成しながらざっと判断する、ということでOKかなと、個人的には思っています。
ちなみに正規分布しているけど分散が等しくないという結果になった場合、
- T検定→WelchのT検定
- 分散分析→一元配置分散分析Welch拡張
- 多重比較→ゲームズハウエル法
という変法を使えば問題ありません。
バートレット検定とF検定の違いは?
「あれ?それってバートレット検定と同じじゃない?」
と思った方も多いと思います。
分散が等しいか確かめる点では、バートレット検定もF検定も同じです。
違うのは、比較する群の数です。
- 2群間の分散をみる→F検定
- 3群以上間の分散をみる→バートレット検定
このように群の数によって使う検定が変わってきます。
実際に検定をかけるときは、群の数を確認してからどちらを使うか決めるようにしましょう。
F検定について詳しく知りたい方はこちらの記事もご覧ください。
バートレット検定はエクセルで実施できる?
バートレット検定をエクセルで実施するのはかなり大変です。
実施できないことはないのですが、計算式が複雑なためすごく時間と手間がかかります(数式を間違えるリスクもあります)。
ですのでバートレット検定をかける際は、フリーソフトのEZRを使うことをおすすめします。
EZRは無料で使うことができ、バートレット検定などの統計検定を簡単にかけることができる統計ソフトです。
なるべく使い慣れたエクセルで済ませたい気持ちも分かりますが、複雑な数式を打つ時間をEZRの勉強に当てた方が確実に時短できますので、是非使ってみて下さい。
バートレット検定をエクセルで実施する方法
どうしてもエクセルを使わないといけない事情がある人に向けて、エクセルでバートレット検定を実施する方法を解説していきますね。
バートレット検定をエクセルで実施するには以下の手順で計算していきます。
- 各群の分散と全体の分散を計算する
- 統計量を算出する(χ2値)
- χ2分布表から統計量が有意水準を上回っているか確認する
ここではA群(n=5),B群(n=8),C群(n=10)に対してバートレット検定をしていってみましょう。
各群の分散と全体の分散を計算する
各群の分散は、エクセル関数の”VAR.S()”を使用しましょう。
次に全体の分散を計算します。
さきほど算出した分散と各群の(標本数-1)を掛け算し、全て足し合わせましょう。
例だと
(A群の分散×4)+(B群の分散×7)+(A群の分散×9)
という具合に計算していきます。
最後に全体の標本数の総数から群の数を引いた数で割ってあげましょう。
例では全体の標本数が5+8+10=23で、群の数が3ですので、23-3=20で割ります。
まとめると、今回の例では
全体の分散={(A群の分散×4)+(B群の分散×7)+(C群の分散×9)} ÷ 20
となります。
ここまでは大丈夫でしょうか?
次の統計量がややこしいので頑張りましょうね!
統計量を算出する
まずはじめに統計量の計算式の概要がこちらです。
とにかく計算量が多いため、一つずつじっくりやっていきましょう。
まずは分子の計算です。
(全体の標本数-群の数)×log(全体の分散)から(各群の標本数-1)×log(各群の分散)を引いています。
例だと
{(23-3)×log(全体の分散)}-{(5-1)×log(A群分散)+(8-1)×log(B群分散)+(10-1)×log(C群分散)}
となります。
logの計算はエクセル関数の”LN()”関数を使いましょう。
常用対数のLOG関数ではなく、自然対数のLN関数なので注意して下さい。
続いて分母の計算です。
分母の中で分数が出てくるので厄介ですが、これも一つずつ計算していきます。
まずは分母の分子部分です。
1/(5-1)+1/(8-1)+1/(10-1)-1/(23-3)
という感じで計算します。
分母は3×3 – 3です。
先程の分子を今計算した分母で割った後、1を足せばOKです。
例だと
{1/(5-1)+1/(8-1)+1/(10-1)-1/(23-3)}÷(3×3 – 3) + 1
という感じです。
ようやく計算式の分母と分子の計算が終わりましたので、分子を分母って割れば統計量が出ます!
かなり大変ですが、ここまで出来れば後もう一息です。
頑張りましょう!
χ2分布表で有意か確認する
こちらでχ2分布表を確認できます。
有意確率は0.05、自由度は(群の数-1)で該当する値を確認しましょう。
先程算出した統計量が該当した値を上回っていれば、有意に分散が等しくないことが示されます。
以上がエクセルでバートレット検定を実施する方法です。
まとめ
最後におさらいをしましょう。
- バートレット検定は、群間の分散が等しいかどうか確かめる検定
- 分散分析などの等分散を仮定した検定を行う前にバートレット検定を行うこともある
- 2群間の分散を確かめる場合はF検定を使う
- バートレット検定を実施する際はエクセルよりもEZRを使用した方が良い
バートレット検定はメインの検定ではなく、事前準備の際に必要な検定です。
そのためあまり話題に上がることはないのですが、統計の知識がある方はバートレット検定を使っています。
間違った統計解析をしないためにも、本記事の内容を覚えておいてもらえれば幸いです。
最後までお読み頂きありがとうございました。
コメント