マンホイットニーの U 検定に最低限必要なサンプル数はいくつか

2022年8月14日2024年9月21日

マンホイットニーのU検定を行う際に最低限何例あればよいか？

＞＞もう統計で悩むのは終わりにしませんか？

↑1万人以上の医療従事者が購読中

マンホイットニーのU検定はどんな計算をしているか？

マンホイットニーのU検定はそもそもどんな計算をしているか、という点から、各群最低何例必要かを考えたい。

数学的には同値になる、方法が2つある。

方法 1

方法１は、数字の大小で大きい場合は１，小さい場合は０、同じ場合は1/2とスコアを付けて合計して、検定統計量を計算する方法だ。

例えば、群ｘの1.04の場合、群ｙの1.15, 0.88, 0.90, 0.74, 1.21と比較すると、0（小さい）、１（大きい）、１、１、０というふうにスコアがつけられる。

これをすべての値について、スコアを付けて合計する。

以下のＲスクリプトでMethod Oneと書いてあるところが、スコアを合計しているところである。

Ux1、Uy1がMethod Oneで計算した結果である。

# wilcoxon rank sum test and mann-whitney U test
x <- c(0.80, 0.83, 1.89, 1.04, 1.45, 2.01)
y <- c(1.15, 0.88, 0.90, 0.74, 1.21)
wilcox.test(x, y)

#Method One:
Ux1 <- sum(
c(0,0,0,1,0),
c(0,0,0,1,0),
c(1,1,1,1,1),
c(0,1,1,1,0),
c(1,1,1,1,1),
c(1,1,1,1,1)
)
Uy1 <- sum(
c(1,1,0,1,0,0),
c(1,1,0,0,0,0),
c(1,1,0,0,0,0),
c(0,0,0,0,0,0),
c(1,1,0,1,0,0)
)

#Method Two:
x.rank <- c(2,3,10,6,9,11)
y.rank <- c(7,4,5,1,8)
Rx <- sum(x.rank)
Ry <- sum(y.rank)
nx <- length(x)
ny <- length(y)
Ux2 <- Rx-nx*(nx+1)/2
Uy2 <- Ry-ny*(ny+1)/2

方法 2

方法２（Method Two）は、両群の値を小さい順に並べて、通しで順位をつけて、群ごとに合計する。

ともに群ごとに１からサンプルサイズ（今回は６と５）までの合計（nx*(nx+1)/2, ny*(ny+1)/2 のところ）を引くと、Ux2, Uy2になる。

結果として、Ux1, Ux2は同じ値になるし、Uy1, Uy2も同じ値になる。

要するに、Method Oneの結果と、Method Twoの結果が一致しているのがわかる。

いずれの方法でも結果は同じということだが、つまりはマンホイットニーのU検定はこのような計算をして検定しているということである。

原著論文の数値表を確認すると、サンプルサイズが大きい群がn=6、小さい群がn=5なので、n=6の表を見ることになる。

m=5で、Uが10（上記ではUy1やUy2が10であった）を見ると .214 とある。

この確率は片側なので、通常の両側検定とするとその倍の 0.428 が求めるべき有意確率である。

R の関数の wilcox.test() で計算すると以下の通りとなり、ほぼ同じ有意確率 0.4286 が得られる。

W=20が検定統計量であるが、Ux1, Ux2の20のほうを使っている。

小さいほうを使うのがもともとの方法であるが、R では、大きいほうを使って計算している。

マンホイットニーのU検定は各群最低何例必要か？

上記の通り、マンホイットニーのUは大きい場合は１、同じ場合は0.5を足し合わせていく、もしくは順位を足し合わせていくだけなので、極端な話 n=1 でも計算できる。

事実、マンホイットニーの原著論文を見ると、最小のサンプルサイズは、n=3, m=1、つまり、群１は３例、群２は１例という状況で検定統計量Uの有意確率を示している。

理論的には、3例と1例の合計4例で解析できるということである。

＞＞もう統計で悩むのは終わりにしませんか？

↑1万人以上の医療従事者が購読中

まとめ

マンホイットニーのU検定がどのような計算をしているのか、原著論文ではどのような想定をしていたのかを確認することで、最低限何例必要かを追求した。

最小のサンプルサイズとして、3例と1例の比較でも理論上は可能であることを確認した。

サンプル数計算については、過去記事参照。

参考文献

マンホイットニーの原著論文

On a Test of Whether one of Two Random Variables is Stochastically Larger than the Other

よかったらシェアしてね！

URLをコピーしました！

URLをコピーしました！

リサーチクエスチョン探し？データ分析？論文投稿？、、、で、もう悩まない！

第1章：臨床研究ではなぜ統計が必要なのか？計画することの重要性

推定ってどんなことをしているの？
臨床研究を計画するってどういうこと？
どうにかして標本平均を母平均に近づけられないか？

第2章：研究目的をどれだけ明確にできるのかが重要

データさえあれば解析でどうにかなる、という考え方は間違い
何を明らかにしたいのか？という研究目的が重要
研究目的は4種類に分けられる
統計専門家に相談する上でも研究目的とPICOを明確化しておく

第3章：p値で結果が左右される時代は終わりました

アメリカ統計協会（ASA）のp値に関する声明で指摘されていること
そうは言っても、本当に有意差がなくてもいいの…？
なぜ統計専門家はp値を重要視していないのか
有意差がない時に「有意な傾向があった」といってもいい？
統計を放置してしまうと非常にまずい

第4章：多くの人が統計を苦手にする理由

残念ながら、セミナー受講だけで統計は使えません。
インプットだけで統計が使えない理由
どうやったら統計の判断力が鍛えられるか？
統計は手段なので正解がないため、最適解を判断する力が必要

第5章：統計を使えるようになるために今日から何をすれば良いか？

論文を読んで統計が使えるようになるための5ステップ

第6章：統計を学ぶために重要な環境

統計の3つの力をバランスよく構築する環境

『統計を身につける5つのステップ』を
通常1,650円 → メルマガ登録で無料でプレゼント

以下のボタンをクリックして、画面に出てくる指示に従って、必要事項を記入してください。

~~通常価格：1,650円~~　→　無料でお届け

【無料】統計を使いこなすための秘策を学ぶ

この記事を書いた人

toukei-er

統計 ER ブログ執筆者

元疫学研究者

コメント一覧（1件）

EZR で Jonckheere-Terpstra 検定を行う方法 – 統計ER より:

2024年9月21日 11:31 AM

[…] マンホイットニーの U 検定に必要なサンプル数はいくつかマンホイットニーのU検定を行う際に最低限何例あればよいか？ […]

返信

【無料プレゼント付き】学会発表・論文投稿に必要な統計を最短で学ぶことができる無料メルマガ

マンホイットニーの U 検定に最低限必要なサンプル数はいくつか

マンホイットニーのU検定はどんな計算をしているか？

方法 1

方法 2

マンホイットニーのU検定は各群最低何例必要か？

まとめ

関連記事

参考文献

リサーチクエスチョン探し？データ分析？論文投稿？、、、で、もう悩まない！

『統計を身につける5つのステップ』を
通常1,650円 → メルマガ登録で無料でプレゼント

この記事を書いた人

コメント

コメント一覧（1件）

コメントするコメントをキャンセル

【無料プレゼント付き】学会発表・論文投稿に必要な統計を最短で学ぶことができる無料メルマガ

マンホイットニーの U 検定に最低限必要なサンプル数はいくつか

マンホイットニーのU検定はどんな計算をしているか？

方法 1

方法 2

マンホイットニーのU検定は各群最低何例必要か？

まとめ

関連記事

参考文献

リサーチクエスチョン探し？データ分析？論文投稿？、、、で、もう悩まない！

『統計を身につける5つのステップ』を通常1,650円 → メルマガ登録で無料でプレゼント

この記事を書いた人

関連記事

コメント

コメント一覧 （1件）

コメントする コメントをキャンセル

『統計を身につける5つのステップ』を
通常1,650円 → メルマガ登録で無料でプレゼント

コメント一覧（1件）

コメントするコメントをキャンセル