R でノンパラメトリック検定の多重比較を実行する方法

2018年8月16日2024年10月13日

ノンパラメトリックの多重比較をRで実施する方法。

＞＞もう統計で悩むのは終わりにしませんか？

↑1万人以上の医療従事者が購読中

ノンパラメトリックとは何か？

ノンパラメトリックとはパラメトリックではないという意味。

パラメトリックとは、パラメーターを使うという意味だ。

パラメーターとは、日本語では母数（ぼすう）と言われて、母集団を表す数値、例えば母平均、母分散などを指す。

たとえばTukey検定やDunnett検定は、母平均、母分散の前提の下、実施される多重比較検定だ。

あわせて読みたい

R でチューキー検定を行う方法 Tukey HSD検定をRで行う方法の解説。 Tukey HSD検定をRで行う方法 aov()とTukeyHSD()という二つの関数を使う。ダネット検定のときと同じように、例としてwarpbreaksと…

あわせて読みたい

R でダネット検定を行う方法ダネット検定は、比較対照群といくつかの実験群を多重比較する方法。 Rでダネット検定をするにはどうしたらよいか？ Rでダネット検定をするには？まずmultcompパッケー…

また、Welchの方法で二群比較を繰り返して、Bonferroni型のp値調整を行う多重比較も、Welchの方法がパラメトリックなので、パラメトリック検定だ。

あわせて読みたい

R でボンフェローニを実行する方法検証試験において、三群以上の平均値を比較したいときに、単純に二群比較を繰り返すと有意水準が甘くなる。有意水準の調整によって簡単に処理する方法がボンフェローニ…

母平均、母分散が前提ではない方法が、ノンパラメトリック検定だ。

ノンパラメトリックの多重比較とは？

一般的な方法

二群のノンパラメトリック検定の代表格は、Wilcoxon ウィルコクソン順位和検定だ。

Mann-Whitney マン・ホイットニーのU検定とも言う。

多重比較は二群比較を繰り返し、Bonferroni型のp値調整を行う。

Bonferroni型のp値調整とは？

あわせて読みたい

Rには、pairwise.wilcox.test()という関数が準備されている。

たとえば、warpbreaksというデータを使って、tensionの高さによってbreaksの数に違いがあるか検定をしてみる。

warpbreaksの説明は以下の記事参照（文中に簡単な説明あり）

あわせて読みたい

Wilcoxonの順位和検定を三回繰り返し、Holmの方法でp値を調整している。

結果の最後のエラーが出ている。

同順位があって正確に計算できていないということだ。

同順位がある場合は正確確率法が望ましい。

> with(warpbreaks, (pairwise.wilcox.test(breaks, tension)))
Pairwise comparisons using Wilcoxon rank sum test
data:  breaks and tension
  L      M
M 0.1470 -
H 0.0052 0.1470
P value adjustment method: holm
Warning messages:
1: In wilcox.test.default(xi, xj, paired = paired, ...) :
cannot compute exact p-value with ties
2: In wilcox.test.default(xi, xj, paired = paired, ...) :
cannot compute exact p-value with ties
3: In wilcox.test.default(xi, xj, paired = paired, ...) :
cannot compute exact p-value with ties

正確確率を用いた方法

同順位がある場合の不正確さを乗り越えるために、正確確率検定 Exact Testを用いる。

また、Exact Testは、等分散性を仮定しなくてもいいので適応範囲が広く、その点でもより適切な方法だ。

Wilcoxon Exact Testは、coinパッケージをインストールして、wilcox_test()という関数で実施する。

インストールは最初の一回だけだ。

install.packages("coin")

追加したパッケージは、使う時に呼び出す必要がある。

library(coin)

pairwise.wilcox.test()のように自動で全ペアを計算してくれないので、手動で三回検定を行う必要がある。

warpbreaksから、tensionのH抜き、L抜き、M抜きの三つのデータセットを作り、それぞれwilcox_coin()で検定する。

distribution=”exact”が正確確率検定の指定だ。

結果は、

LとH： p = 0.001147

LとM：p = 0.07194

MとH：p = 0.08857

> warpbreaks.LM <- subset(warpbreaks, warpbreaks$tension!="H")
> warpbreaks.MH <- subset(warpbreaks, warpbreaks$tension!="L")
> warpbreaks.HL <- subset(warpbreaks, warpbreaks$tension!="M")
> wilcox_test(breaks~tension, data=warpbreaks.LM, distribution="exact")
Exact Wilcoxon-Mann-Whitney Test
data:  breaks by tension (L, M)
Z = 1.8056, p-value = 0.07194
alternative hypothesis: true mu is not equal to 0
> wilcox_test(breaks~tension, data=warpbreaks.MH, distribution="exact")
Exact Wilcoxon-Mann-Whitney Test
data:  breaks by tension (M, H)
Z = 1.7117, p-value = 0.08857
alternative hypothesis: true mu is not equal to 0
> wilcox_test(breaks~tension, data=warpbreaks.HL, distribution="exact")
Exact Wilcoxon-Mann-Whitney Test
data:  breaks by tension (L, H)
Z = 3.1507, p-value = 0.001147
alternative hypothesis: true mu is not equal to 0

HolmとHochbergの方法で調整すると？

結論として、LとHだけが統計学的有意に異なるという結果だ。

下表の黄色ハイライトの部分。

Holmの方法

Holmの方法は、三つのp値のうちもっとも小さいp値からチェックしていく。

今回のように三ペアあるなら、もっとも小さいp値を3倍して0.05と比較する。

0.05より小さいので、第一段階突破！

次に大きいLとMのp値のチェックに移る。

LとMのp値は2倍して0.05と比較する。

0.05より大きくいので、ここでチェック終了。

Holmの方法では、LとHペアのみ統計学的有意。

Hochbergの方法

Hochbergの方法は、もっとも大きいp値からチェック開始。

もっとも大きいp値と0.05を比較する。

0.05より大きいので、次に移る。

次に大きいp値を2倍して0.05と比較する。

これも0.05より大きいので、もっとも小さいp値に移る。

もっとも小さいp値を3倍して0.05と比較する。

これは0.05より小さいので、このペアは統計学的有意に異なるといえる。

もし、もっと小さいp値のペアがある場合、もっと小さいp値はチェックなしで統計学的有意になる。

これがHochbergの方法だ。

今回は、結果としてHolmもHochbergも同じだった。

ペア	調整なし	Holm	Hochberg
LとH	0.001147	(1) \begin{array}{lcl} 0.00147 \times 3 \\ = 0.003441 \\ \lt 0.05 \end{array}	(3) \begin{array}{lcl} 0.001147 \times 3 \\ = 0.003441 \\ \lt 0.05 \end{array}
LとM	0.07194	(2) \begin{array}{lcl} 0.07194 \times 2 \\ = 0.14388 \\ \gt 0.05 \end{array}	(2) \begin{array}{lcl} 0.07194 \times 2 \\ = 0.14388 \\ \gt 0.05 \end{array}
MとH	0.08857		(1) \begin{array}{lcl} 0.08857 \times 1 \\ = 0.08857 \\ \gt 0.05 \end{array}

＞＞もう統計で悩むのは終わりにしませんか？

↑1万人以上の医療従事者が購読中

まとめ

測定値のような数値データで、三群以上を多重比較したい場合、データが正規分布しているか不明なら、ノンパラメトリック検定を使うとよい。

適切な方法はWilcoxon Exact Testを繰り返して行い、Bonferroni型のp値調整を行う方法だ。

p値調整法は、HolmかHochbergがおすすめだが、検出力の高いHochbergの方法がよりおすすめだ。

よかったらシェアしてね！

URLをコピーしました！

URLをコピーしました！

リサーチクエスチョン探し？データ分析？論文投稿？、、、で、もう悩まない！

第1章：臨床研究ではなぜ統計が必要なのか？計画することの重要性

推定ってどんなことをしているの？
臨床研究を計画するってどういうこと？
どうにかして標本平均を母平均に近づけられないか？

第2章：研究目的をどれだけ明確にできるのかが重要

データさえあれば解析でどうにかなる、という考え方は間違い
何を明らかにしたいのか？という研究目的が重要
研究目的は4種類に分けられる
統計専門家に相談する上でも研究目的とPICOを明確化しておく

第3章：p値で結果が左右される時代は終わりました

アメリカ統計協会（ASA）のp値に関する声明で指摘されていること
そうは言っても、本当に有意差がなくてもいいの…？
なぜ統計専門家はp値を重要視していないのか
有意差がない時に「有意な傾向があった」といってもいい？
統計を放置してしまうと非常にまずい

第4章：多くの人が統計を苦手にする理由

残念ながら、セミナー受講だけで統計は使えません。
インプットだけで統計が使えない理由
どうやったら統計の判断力が鍛えられるか？
統計は手段なので正解がないため、最適解を判断する力が必要

第5章：統計を使えるようになるために今日から何をすれば良いか？

論文を読んで統計が使えるようになるための5ステップ

第6章：統計を学ぶために重要な環境

統計の3つの力をバランスよく構築する環境

『統計を身につける5つのステップ』を
通常1,650円 → メルマガ登録で無料でプレゼント

以下のボタンをクリックして、画面に出てくる指示に従って、必要事項を記入してください。

~~通常価格：1,650円~~　→　無料でお届け

【無料】統計を使いこなすための秘策を学ぶ

この記事を書いた人

toukei-er

統計 ER ブログ執筆者

元疫学研究者

【無料プレゼント付き】学会発表・論文投稿に必要な統計を最短で学ぶことができる無料メルマガ

R でノンパラメトリック検定の多重比較を実行する方法

ノンパラメトリックとは何か？

ノンパラメトリックの多重比較とは？

一般的な方法

Bonferroni型のp値調整とは？

正確確率を用いた方法

HolmとHochbergの方法で調整すると？

Holmの方法

Hochbergの方法

まとめ

リサーチクエスチョン探し？データ分析？論文投稿？、、、で、もう悩まない！

『統計を身につける5つのステップ』を
通常1,650円 → メルマガ登録で無料でプレゼント

この記事を書いた人

コメント

コメントするコメントをキャンセル

【無料プレゼント付き】学会発表・論文投稿に必要な統計を最短で学ぶことができる無料メルマガ

R でノンパラメトリック検定の多重比較を実行する方法

ノンパラメトリックとは何か？

ノンパラメトリックの多重比較とは？

一般的な方法

Bonferroni型のp値調整とは？

正確確率を用いた方法

HolmとHochbergの方法で調整すると？

Holmの方法

Hochbergの方法

まとめ

リサーチクエスチョン探し？データ分析？論文投稿？、、、で、もう悩まない！

『統計を身につける5つのステップ』を通常1,650円 → メルマガ登録で無料でプレゼント

この記事を書いた人

関連記事

コメント

コメントする コメントをキャンセル

『統計を身につける5つのステップ』を
通常1,650円 → メルマガ登録で無料でプレゼント

コメントするコメントをキャンセル