この記事では、統計解析ソフトEZRを使ったクラスカルウォリス検定の実施方法について具体的に説明していきます。
3群以上のデータがあるときの検定で、よく用いられるのは分散分析(ANOVA分析)。
分散分析は「対応のないデータに対するパラメトリックな検定」ですね。
その一方で、「対応のないデータに対するノンパラメトリックな検定」がクラスカル・ウォリス検定です。
また、EZRで出力されたクラスカルウォリス検定の結果の解釈についても見ていきます。
EZRでクラスカルウォリス検定!そもそもクラスカルウォリス検定とは?
クラスカル・ウォリス検定は、”3群以上のデータの分布に違いがある群があるか”を検定する方法です。
分散分析はパラメトリックな検定であるデータの分散をもとにした解析方法。
その一方で、クラスカル・ウォリス検定はノンパラメトリックな検定。
クラスカル・ウォリス検定では次のデータが必要です。
- 連続データ
- 3群以上の1つカテゴリーデータ
例えば、薬剤A、BまたはCで処理したというような感じです。
EZRで分散分析を実施する方法はこちらの記事をご覧ください。
EZRでクラスカルウォリス検定を実施する
それでは、統計解析ソフトEZRを用いてクラスカル・ウォリス検定を行っていきましょう。
EZRでクラスカルウォリス検定をするためのデータを読み込む
今回の記事では、自治医科大学さんが提供してくださっているサンプルデータの中から「LDH.rda」を使用して解説いたします。
早速、データをEZRにインポートしましょう。
EZRを開き、「ファイル」→「既存のデータセットを読み込む」を選択します。
そして、データを保存したフォルダに移動し、「LDH.rda」を選択してOKを押します。
データセットが「LDH」になっていることを確認し、「表示」を押してデータが正しく表示されれば取り込み完了です。
このデータの中身を見てみましょう。
クラスカルウォリス検定では、
- 連続データ
- 3群以上の1つカテゴリーデータ
が必要と述べました。
このデータでは、[連続データ]として「LDH」、[3群以上のカテゴリーデータ]として、「Group」の項目が対応します。
EZRでクラスカルウォリス検定をするには「一元配置分析」を選択する
それでは、これからEZRでクラスカルウォリス検定をしていきましょう。
EZRでクラスカルウォリス検定をするには「統計解析」→「ノンパラメトリック検定」→「3群以上の比較(Kruskal-Wallis検定)」を選択します。
- 目的変数(1つ選択)で「LDH」を選択します。
- 比較する群(1つ以上選択)で「Group」を選択します。
- 他は、いじらなくてOKです。
これで、クラスカルウォリス検定が実施できました。
下記のように分析結果が出力されています。
p値は0.0155とあるので、LDHに対して群ABCの違いに有意差がありそうです。
EZRでクラスカルウォリス検定:結果の解釈や結果の書き方は?
無事にEZRでクラスカルウォリス検定を実施することができました。
では、得られた結果から何が言えるのでしょうか?
もう一度、クラスカルウォリス検定の結果を見てみましょう。
この結果からのP値は、P=0.0155です。
帰無仮説と対立仮説を確認しましょう!
- 帰無仮説H0:A群の分布=B群の分布=C群の分布
- 対立仮説H1:A群の分布、B群の分布、C群の分布の中で少なくともどれか一つが異なる
注目したいのは対立仮説で、「どこかの特定の群間に違いがあるかどうかはクラスカルウォリス検定ではわからない」ということ。
ここだけは間違わないようにしましょう。
特定の群間に違いがあるかどうかは、2群の多重比較をしていくことになります。
クラスカルウォリス検定を実施した際の結果の書き方は?
上記の通り、クラスカルウォリス検定を実施して有意差があったとしても、わかることは「少なくともどこかの群の分布が異なる」というだけであり、特定のどの群で違いがあるかどうかに関しては、全くわかりません。
そのため、結果の書き方としても以下の数値を示して終了、という感じになるかと思います。
- 各群の中央値と四分位範囲(もしくは範囲)
- クラスカルウォリス検定のp値
ここのp値は名目上のp値として、有意差があるかどうかに言及せずに参考値程度にp値を示すだけにとどめるといいです。
EZRでクラスカルウォリス検定をする方法:まとめ
いかがでしたか?
EZRでクラスカルウォリス検定をできるようなり、自由自在にデータを解析できるようにしましょう!
結果の解釈にも注意が必要な点は、ぜひ理解しておいてくださいね!
コメント