MENU

マンホイットニーの U 検定に最低限必要なサンプル数はいくつか

マンホイットニーのU検定を行う際に最低限何例あればよいか?

>>もう統計で悩むのは終わりにしませんか? 

↑期間・数量限定で無料プレゼント中!

目次

マンホイットニーのU検定はどんな計算をしているか?

マンホイットニーのU検定はそもそもどんな計算をしているか、という点から、各群最低何例必要かを考えたい。

数学的には同値になる、方法が2つある。

方法 1

方法1は、数字の大小で大きい場合は1,小さい場合は0、同じ場合は1/2とスコアを付けて合計して、検定統計量を計算する方法だ。

例えば、群xの1.04の場合、群yの1.15, 0.88, 0.90, 0.74, 1.21と比較すると、0(小さい)、1(大きい)、1、1、0というふうにスコアがつけられる。

これをすべての値について、スコアを付けて合計する。

以下のRスクリプトでMethod Oneと書いてあるところが、スコアを合計しているところである。

Ux1、Uy1がMethod Oneで計算した結果である。

# wilcoxon rank sum test and mann-whitney U test
x <- c(0.80, 0.83, 1.89, 1.04, 1.45, 2.01)
y <- c(1.15, 0.88, 0.90, 0.74, 1.21)
wilcox.test(x, y)

#Method One:
Ux1 <- sum(
c(0,0,0,1,0),
c(0,0,0,1,0),
c(1,1,1,1,1),
c(0,1,1,1,0),
c(1,1,1,1,1),
c(1,1,1,1,1)
)
Uy1 <- sum(
c(1,1,0,1,0,0),
c(1,1,0,0,0,0),
c(1,1,0,0,0,0),
c(0,0,0,0,0,0),
c(1,1,0,1,0,0)
)

#Method Two:
x.rank <- c(2,3,10,6,9,11)
y.rank <- c(7,4,5,1,8)
Rx <- sum(x.rank)
Ry <- sum(y.rank)
nx <- length(x)
ny <- length(y)
Ux2 <- Rx-nx*(nx+1)/2
Uy2 <- Ry-ny*(ny+1)/2

方法 2

方法2(Method Two)は、両群の値を小さい順に並べて、通しで順位をつけて、群ごとに合計する。

ともに群ごとに1からサンプルサイズ(今回は6と5)までの合計(nx*(nx+1)/2, ny*(ny+1)/2 のところ)を引くと、Ux2, Uy2になる。

結果として、Ux1, Ux2は同じ値になるし、Uy1, Uy2も同じ値になる。

要するに、Method Oneの結果と、Method Twoの結果が一致しているのがわかる。

いずれの方法でも結果は同じということだが、つまりはマンホイットニーのU検定はこのような計算をして検定しているということである。

原著論文の数値表を確認すると、サンプルサイズが大きい群がn=6、小さい群がn=5なので、n=6の表を見ることになる。

m=5で、Uが10(上記ではUy1やUy2が10であった)を見ると .214 とある。

この確率は片側なので、通常の両側検定とするとその倍の 0.428 が求めるべき有意確率である。

R の関数の wilcox.test() で計算すると以下の通りとなり、ほぼ同じ有意確率 0.4286 が得られる。

W=20が検定統計量であるが、Ux1, Ux2の20のほうを使っている。

小さいほうを使うのがもともとの方法であるが、R では、大きいほうを使って計算している。

マンホイットニーのU検定は各群最低何例必要か?

上記の通り、マンホイットニーのUは大きい場合は1、同じ場合は0.5を足し合わせていく、もしくは順位を足し合わせていくだけなので、極端な話 n=1 でも計算できる。

事実、マンホイットニーの原著論文を見ると、最小のサンプルサイズは、n=3, m=1、つまり、群1は3例、群2は1例という状況で検定統計量Uの有意確率を示している。

理論的には、3例と1例の合計4例で解析できるということである。

>>もう統計で悩むのは終わりにしませんか? 

↑1万人以上の医療従事者が購読中

まとめ

マンホイットニーのU検定がどのような計算をしているのか、原著論文ではどのような想定をしていたのかを確認することで、最低限何例必要かを追求した。

最小のサンプルサイズとして、3例と1例の比較でも理論上は可能であることを確認した。

関連記事

サンプル数計算については、過去記事参照。

参考文献

マンホイットニーの原著論文

On a Test of Whether one of Two Random Variables is Stochastically Larger than the Other

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

リサーチクエスチョン探し?データ分析?論文投稿?、、、で、もう悩まない!

第1章臨床研究ではなぜ統計が必要なのか?計画することの重要性
  • 推定ってどんなことをしているの?
  • 臨床研究を計画するってどういうこと?
  • どうにかして標本平均を母平均に近づけられないか?
第2章:研究目的をどれだけ明確にできるのかが重要
  • データさえあれば解析でどうにかなる、という考え方は間違い
  • 何を明らかにしたいのか? という研究目的が重要
  • 研究目的は4種類に分けられる
  • 統計専門家に相談する上でも研究目的とPICOを明確化しておく
第3章:p値で結果が左右される時代は終わりました
  • アメリカ統計協会(ASA)のp値に関する声明で指摘されていること
  • そうは言っても、本当に有意差がなくてもいいの…?
  • なぜ統計専門家はp値を重要視していないのか
  • 有意差がない時に「有意な傾向があった」といってもいい?
  • 統計を放置してしまうと非常にまずい
第4章:多くの人が統計を苦手にする理由
  • 残念ながら、セミナー受講だけで統計は使えません。
  • インプットだけで統計が使えない理由
  • どうやったら統計の判断力が鍛えられるか?
  • 統計は手段なので正解がないため、最適解を判断する力が必要
第5章:統計を使えるようになるために今日から何をすれば良いか?
  • 論文を読んで統計が使えるようになるための5ステップ
第6章:統計を学ぶために重要な環境
  • 統計の3つの力をバランスよく構築する環境

以下のボタンをクリックして、画面に出てくる指示に従って、必要事項を記入してください。

この記事を書いた人

統計 ER ブログ執筆者

元疫学研究者

統計解析が趣味

コメント

コメント一覧 (1件)

コメントする

目次