R で連続データの 2 群比較を行う方法

2018年7月16日2024年10月13日

実験群とコントロール群、リスク因子あり群となし群、介入群と非介入群、など二群比較を R で実行する方法。

＞＞もう統計で悩むのは終わりにしませんか？

↑1万人以上の医療従事者が購読中

群ごとに平均値・標準偏差・中央値を求める

平均値を計算するなら tapply(var1, grp, mean) を使用する。

grpのグループごとに、var1の平均値を計算する。

標準偏差を計算するなら、meanをsdに変える。

tapply(var1, grp, sd)

中央値はmedianと指定する。

tapply(var1, grp, median)

例：

with(sleep, tapply(extra, group, mean))
with(sleep, tapply(extra, group, sd))
with(sleep, tapply(extra, group, median))

> with(sleep, tapply(extra, group, mean))
1    2
0.75 2.33
>
> with(sleep, tapply(extra, group, sd))
1        2
1.789010 2.002249
>
> with(sleep, tapply(extra, group, median))
1    2
0.35 1.75

平均値の差の検定　ウェルチの方法

t.test()を使う。

統計ソフトRでは、平均値の差の検定は、ウェルチ（Welch）の方法がデフォルト。

ウェルチの方法は、二群が等分散かどうかを問題にしない。

等分散とみなせるときは、等分散の式で計算した結果と同様になる。

なので、いつでもウェルチを使っておけばよい。

例：

library(MASS)
with(birthwt, t.test(bwt~smoke))

> with(birthwt, t.test(bwt~smoke))
Welch Two Sample t-test
data:  bwt by smoke
t = 2.7299, df = 170.1, p-value = 0.007003
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
78.57486 488.97860
sample estimates:
mean in group 0 mean in group 1
3055.696        2771.919

＞＞もう統計で悩むのは終わりにしませんか？

↑1万人以上の医療従事者が購読中

ウィルコクソンの順位和正確検定

coinパッケージのwilcox_test()を使う。

ウィルコクソン（Wilcoxon）の順位和検定は、マン・ホイットニー（Mann-Whitney）のU検定という名前でも知られるノンパラメトリック検定。

母集団が正規分布しているかどうか不明なデータで二群の比較したい場合に使う。

また、等分散かどうかを気にしなくていいように、正確確率検定 Exact Testを行う。

最初に一回だけパッケージをインストールする。

例：

install.packages("coin")
library(coin)
wilcox_test(bwt ~ factor(smoke), data=birthwt)

> wilcox_test(bwt ~ factor(smoke), data=birthwt, distribution="exact")
Exact Wilcoxon-Mann-Whitney Test
data:  bwt by factor(smoke) (0, 1)
Z = 2.7094, p-value = 0.006549
alternative hypothesis: true mu is not equal to 0

まとめ

連続量の二群比較の基本として、

平均値
標準偏差
中央値
ウェルチの検定
ウィルコクソンの順位和検定

の方法を解説した。

参考になれば。

参考書籍

中澤港著　Rによる保健医療データ解析演習　ピアソン・エデュケーション
11.1.2 ウィルコクソンの順位和検定 pp.162-167

Rによる保健医療データ解析演習 (Computer in Education and Research)

作者:中澤港
ピアソンエデュケーション

Amazon

よかったらシェアしてね！

URLをコピーしました！

URLをコピーしました！

リサーチクエスチョン探し？データ分析？論文投稿？、、、で、もう悩まない！

第1章：臨床研究ではなぜ統計が必要なのか？計画することの重要性

推定ってどんなことをしているの？
臨床研究を計画するってどういうこと？
どうにかして標本平均を母平均に近づけられないか？

第2章：研究目的をどれだけ明確にできるのかが重要

データさえあれば解析でどうにかなる、という考え方は間違い
何を明らかにしたいのか？という研究目的が重要
研究目的は4種類に分けられる
統計専門家に相談する上でも研究目的とPICOを明確化しておく

第3章：p値で結果が左右される時代は終わりました

アメリカ統計協会（ASA）のp値に関する声明で指摘されていること
そうは言っても、本当に有意差がなくてもいいの…？
なぜ統計専門家はp値を重要視していないのか
有意差がない時に「有意な傾向があった」といってもいい？
統計を放置してしまうと非常にまずい

第4章：多くの人が統計を苦手にする理由

残念ながら、セミナー受講だけで統計は使えません。
インプットだけで統計が使えない理由
どうやったら統計の判断力が鍛えられるか？
統計は手段なので正解がないため、最適解を判断する力が必要

第5章：統計を使えるようになるために今日から何をすれば良いか？

論文を読んで統計が使えるようになるための5ステップ

第6章：統計を学ぶために重要な環境

統計の3つの力をバランスよく構築する環境

『統計を身につける5つのステップ』を
通常1,650円 → メルマガ登録で無料でプレゼント

以下のボタンをクリックして、画面に出てくる指示に従って、必要事項を記入してください。

~~通常価格：1,650円~~　→　無料でお届け

【無料】統計を使いこなすための秘策を学ぶ

この記事を書いた人

toukei-er

統計 ER ブログ執筆者

元疫学研究者

【無料プレゼント付き】学会発表・論文投稿に必要な統計を最短で学ぶことができる無料メルマガ

R で連続データの 2 群比較を行う方法

群ごとに平均値・標準偏差・中央値を求める

平均値の差の検定　ウェルチの方法

ウィルコクソンの順位和正確検定

まとめ

参考書籍

リサーチクエスチョン探し？データ分析？論文投稿？、、、で、もう悩まない！

『統計を身につける5つのステップ』を
通常1,650円 → メルマガ登録で無料でプレゼント

この記事を書いた人

コメント

コメントするコメントをキャンセル

【無料プレゼント付き】学会発表・論文投稿に必要な統計を最短で学ぶことができる無料メルマガ

R で連続データの 2 群比較を行う方法

群ごとに平均値・標準偏差・中央値を求める

平均値の差の検定 ウェルチの方法

ウィルコクソンの順位和正確検定

まとめ

参考書籍

リサーチクエスチョン探し？データ分析？論文投稿？、、、で、もう悩まない！

『統計を身につける5つのステップ』を通常1,650円 → メルマガ登録で無料でプレゼント

この記事を書いた人

関連記事

コメント

コメントする コメントをキャンセル

平均値の差の検定　ウェルチの方法

『統計を身につける5つのステップ』を
通常1,650円 → メルマガ登録で無料でプレゼント

コメントするコメントをキャンセル