3群以上のデータがあるときの検定で、よく用いられるのは分散分析(ANOVA分析)。
分散分析は「対応のないデータに対するパラメトリックな検定」ですね。
その一方で、「対応のないデータに対するノンパラメトリックな検定」がクラスカル・ウォリス検定です。
この記事では、統計解析ソフトJMPを使ったクラスカル・ウォリス検定の実施方法について具体的に説明していきます。
また、JMPで出力されたクラスカル・ウォリス検定の結果の解釈についても見ていきます。
JMPでクラスカル・ウォリス検定!そもそもクラスカル・ウォリス検定とは?
クラスカル・ウォリス検定は、”3群以上のデータの分布に違いがある群があるか”を検定する方法です。
分散分析はパラメトリックな検定であるデータの分散をもとにした解析方法。
その一方で、クラスカル・ウォリス検定はノンパラメトリックな検定。
クラスカル・ウォリス検定では次のデータが必要です。
- 連続データ
- 3群以上の1つカテゴリーデータ
例えば、薬剤A、BまたはCで処理したというような感じです。
JMPで分散分析を実施する方法はこちらの記事をご覧ください。
JMPでクラスカル・ウォリス検定(Kruskal-wallis検定)を実施する
それでは、統計解析ソフトJMPを用いてクラスカル・ウォリス検定を行っていきましょう。
JMPでクラスカル・ウォリス検定をするためのデータを読み込む
自分たちのデータを解析する場合は、
[ファイル] > [開く]から解析したデータを開いてください。
ExcelやCSV形式のデータを開くことができます。
この記事では、JMPにすでに用意されているサンプルデータを使います。
JMPで分散分析を実施した記事と同じデータを使用します。
[ヘルプ] > [サンプルライブラリー]をクリックします。
すると、次のサンプルデータのディレクトリのウィンドウが出てきます。
今回はこの中の”Analgesics.jmp”を使います。
このデータは、
33人の被験者が3種類の鎮痛剤(A、B、C)を服用し、痛みの程度を数値で評価
したデータです。
では、データの中身を見ていきましょう。
クラスカル・ウォリス検定では、
- 連続データ
- 3群以上の1つカテゴリーデータ
が必要と述べました。
このデータでは、[連続データ]として「痛みの程度」、[3群以上の2つカテゴリーデータ]として、「薬」の項目が対応します。
JMPでクラスカル・ウォリス検定をするには「一元配置分析」を選択する
それでは、一元配置分析を行っていきます。
[分析] > [二変量の関係]をクリックします。
クリックすると次のウィンドウが出現します。
[Y, 目的変数]に「痛みの程度」を選択します。
[X, 説明変数]に「薬」を選択します。
選択できたら[OK]をクリックするとグラフが出力されます。
次に、「薬による痛みの程度の一元配置分析」の▼をクリックします。
そして「ノンパラメトリック」→「Wilcoxon検定」を選択。
(あれ、クラスカル・ウォリス検定じゃなくてWilcoxo検定・・・?)
と思ったかもしれません。
でも、右側にある注釈を見てください。
注釈には「グループが3つ以上の場合は、Kruskal-Wallis検定と呼ばれる。」と書いてあります。
つまり、群が3つ以上あれば、自動的にクラスカル・ウォリス検定を実施してくれるのです。
これで、クラスカル・ウォリス検定が実施できました。
下の欄に分析結果が出力されています。
p値は0.0029とあるので、痛みの程度に対して薬ABCの違いに有意差がありそうです。
JMPでクラスカル・ウォリス検定:結果の解釈は?
無事にJMPでクラスカル・ウォリス検定を実施することができました。
では、得られた結果から何が言えるのでしょうか?
もう一度、クラスカル・ウォリス検定の結果を見てみましょう。
この結果からのP値は、P=0.0029です。
帰無仮説と対立仮説を確認しましょう!
- 帰無仮説H0:A群の分布=B群の分布=C群の分布
- 対立仮説H1:A群の分布、B群の分布、C群の分布の中で少なくともどれか一つが異なる
注目したいのは対立仮説で、「どこかの特定の群間に違いがあるかどうかはクラスカル・ウォリス検定ではわからない」ということ。
ここだけは間違わないようにしましょう。
クラスカル・ウォリス検定で有意だったら事後検定する?
3群以上ある場合の世間的な認識として、
- まずは分散分析(ANOVA)やクラスカル・ウォリス検定ををする
- 分散分析で有意差があった場合には、対比較(2群間の多重比較)を複数回実施する
という手順が、まるで絶対的に正しいように書かれていることが多いです。
しかし、この手順は必ずしも正しくありません。
なぜなら、分散分析と対比較(2群間の比較)の多重検定では有意差があった時に見出せること(結論づけられること)が全く違うから。
対比較だと、有意差が出た場合には明確に「どこの群とどこの群(例えばA群とB群)の間に違いがある」という結論になります。
つまり、研究目的として最初から「どこの群とどこの群(例えばA群とB群)の間に違いがある」のかを知りたいのなら、分散分析は不要なんです。
なぜなら、クラスカル・ウォリス検定をしても「どこの群とどこの群(例えばA群とB群)の間に違いがある」という結論は検定の性質上、導き出せないからです。
JMPでクラスカル・ウォリス検定をする方法:まとめ
いかがでしたか?
JMPでクラスカル・ウォリス検定をできるようなり、自由自在にデータを解析できるようにしましょう!
株式会社データシードは、SAS社のJMP事業部と提携しています。
統計解析担当者として10年間色々な統計解析ソフトを試した結果、本当に使いやすいと思ったのがJMPでした。
ぜひあなたもJMPの全機能を30日間試せるトライアル版で、データからさらなる情報を導き出せることを実感してください。
コメント