MENU

クラスカルウォリス検定の各群サンプル数条件とタイデータの影響

クラスカルウォリス検定を、原著に立ち返って、わかりやすく解説。

各群のサンプル数が偏ってはいけないなどの条件があるのかどうか、また、タイデータ(同順位データ)の影響について。

>>もう統計で悩むのは終わりにしませんか? 

↑期間・数量限定で無料プレゼント中!

目次

クラスカルウォリス検定とは?

クラスカルウォリス検定とは、3群以上の群があったときの順位を用いたノンパラメトリックな分散分析と考えればよい。

各群の平均順位を比較していると理解すればOKである。

以下も参照のこと。

検定統計量 H を計算して、有意確率を求めることになる。

\begin{equation}
H = \frac{12}{N(N+1)} \sum \frac{R^2}{n} – 3(N+1)
\end{equation}

ここで、N は全群を合わせたサンプルサイズ、$ R^2 $ は各群の順位の合計の2乗、n は各群のサンプルサイズ、$ \sum $ は添え字を省略しているが、各群の値が計算されたら、全群を合計する意味である。

この検定統計量は以下のようにも書ける。

\begin{equation}
H = \frac{N-1}{N} \sum \frac{n (\bar{R} – \frac{1}{2} (N + 1))^2}{(N^2-1)/12}
\end{equation}

ここで、上の式と同じ記号は同じものを指していて、上には登場しなかった $ \bar{R} $ は各群の平均順位を表している。

$ \frac{1}{2} (N + 1) $ は、N 個の順位の平均順位の公式である。

なので、$ (\bar{R} – \frac{1}{2} (N + 1))^2 $ の部分は、各群の平均順位と全体の平均順位の差の2乗を計算していることがわかる。

まさにこの部分が平均順位を使った群間比較という形の分散分析と理解できるゆえんである。

この式にすると、各群の平均順位を比べていることが良くわかる。

そして、この検定統計量が 自由度 群の数ー1 (例えば全3群であれば2)の $ \chi^2 $ 分布に従うという性質を使って有意確率を求める。

有意水準(例えば5%)よりも有意確率が小さければ、比較した群たちは、統計学的有意に異なると言える。

クラスカルウォリス検定は各群のサンプルサイズが同程度であることが条件か?

ネット上には、各群のサンプルサイズが異なることを心配して相談している相談者が散見されたが、クラスカルウォリス検定において、各群のサンプルサイズが同程度であることが条件であるという記述は見つからなかった。

原著論文の計算式を確認しても、そのような条件は書いていない。

したがって、各群のサンプルサイズが同程度であることが条件であるとは言えない。

>>もう統計で悩むのは終わりにしませんか? 

↑1万人以上の医療従事者が購読中

クラスカルウォリス検定における タイデータの支障の程度はどのくらいか?

タイ (tie) データというのは、連続データで同じ値のデータで、順位に変換すると同順位になるデータのこと。

タイデータがある場合は、その数に応じて検定統計量を調整することになる。

タイデータは、以下の式で調整値を計算して、その値で検定統計量 H を割る。

\begin{equation}
1 – \frac{\sum T}{N^3-N}
\end{equation}

ここで、$ T = (t – 1) t (t + 1) = t^3 – t $ と計算するのだが、t は、タイ順位グループ内の個数である。

5個タイがある順位があるとするとその時の T は、$ 5^3 – 5 = 125 – 5 = 120 $ となる。

10個タイがある順位の場合は、$ T = 10^3 – 10 = 1000 – 10 = 990 $ となり、タイが増えると T はどんどん大きくなるが、分子が分母を超えることはない。

N は、すべての群の例数を足し合わせた総サンプルサイズである。

タイの数が大きくなればなるほど、分子が大きくなり、式全体の値は1より小さくなっていく。

1より小さい値で検定統計量を割ると、検定統計量は大きくなる。

つまりは、より統計学的有意に近くなるわけである。

ということは、タイデータが増えても、少なくとも統計学的に不利となることはなさそうだ。

まとめ

クラスカルウォリス検定を原著に立ち返って、少々の計算式を交えながら、わかりやすく解説した。

クラスカルウォリス検定が適切である条件として、各群のサンプルサイズが同程度であることが必要かどうか確認したところ、そのような記載は見つけることができなかった。

また、タイデータが増えることが何か支障があるかどうかを確認したところ、支障をきたすという証拠は得られなかった。

したがって、クラスカルウォリス検定は、各群のサンプルサイズの大きさが異なっていても心配せず実施できるし、タイデータが多くても心配せずに実施できると言える。

原著論文リンク

William H. Kruskal and W. Allen Wallis. Use of Ranks in One-Criterion Variance Analysis

https://people.ucalgary.ca/~jefox/Kruskal%20and%20Wallis%201952.pdf

参考リンク

Kruskal Wallis test for unequal group size?

Kruskal Wallis test for unequal group size? | ResearchGate

spss – Non-parametric test for unequal samples with subsequent post-hoc analysis? – Cross Validated

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

リサーチクエスチョン探し?データ分析?論文投稿?、、、で、もう悩まない!

第1章臨床研究ではなぜ統計が必要なのか?計画することの重要性
  • 推定ってどんなことをしているの?
  • 臨床研究を計画するってどういうこと?
  • どうにかして標本平均を母平均に近づけられないか?
第2章:研究目的をどれだけ明確にできるのかが重要
  • データさえあれば解析でどうにかなる、という考え方は間違い
  • 何を明らかにしたいのか? という研究目的が重要
  • 研究目的は4種類に分けられる
  • 統計専門家に相談する上でも研究目的とPICOを明確化しておく
第3章:p値で結果が左右される時代は終わりました
  • アメリカ統計協会(ASA)のp値に関する声明で指摘されていること
  • そうは言っても、本当に有意差がなくてもいいの…?
  • なぜ統計専門家はp値を重要視していないのか
  • 有意差がない時に「有意な傾向があった」といってもいい?
  • 統計を放置してしまうと非常にまずい
第4章:多くの人が統計を苦手にする理由
  • 残念ながら、セミナー受講だけで統計は使えません。
  • インプットだけで統計が使えない理由
  • どうやったら統計の判断力が鍛えられるか?
  • 統計は手段なので正解がないため、最適解を判断する力が必要
第5章:統計を使えるようになるために今日から何をすれば良いか?
  • 論文を読んで統計が使えるようになるための5ステップ
第6章:統計を学ぶために重要な環境
  • 統計の3つの力をバランスよく構築する環境

以下のボタンをクリックして、画面に出てくる指示に従って、必要事項を記入してください。

この記事を書いた人

統計 ER ブログ執筆者

元疫学研究者

統計解析が趣味

コメント

コメント一覧 (1件)

コメントする

目次