MENU

R でケースコントロール研究に必要なサンプルサイズを計算する方法

ケースコントロール研究のオッズ比を求めるためのサンプルサイズ計算はどうやるのか?

>>もう統計で悩むのは終わりにしませんか? 

↑期間・数量限定で無料プレゼント中!

目次

ケースコントロール研究のサンプルサイズ計算の前提

一般人の危険因子にさらされている割合をfとする。

想定されるオッズ比をRとする。

前提はこの二つだけだ。

この二つの条件を先行研究から見つけるか、妥当な値を何らかの根拠を持って決める。

ケースコントロール研究のサンプルサイズ計算のスクリプト

R で計算する場合、以下のスクリプトで計算できる。

sample.size.case.control <- function (f, R, alpha=0.05, power=0.8){
p3 <- f*R/(1+f*(R-1))
q3 <- 1-p3
u <- 1/2*f*(1+R/(1+f*(R-1)))
n <- (qnorm(alpha/2, lower.tail=F)*sqrt(2*u*(1-u))+qnorm(power)*sqrt(f*(1-f)+p3*q3))^2/(f-p3)^2
METHOD <- "Case Control Study Sample Size Calculation"
NOTE <- "n is number in *each* group"
structure(list(n=n,"Prop exposed in gen pop"=f, "Assumed Odds Ratio"=R, sig.level=alpha, power=power, method=METHOD, note=NOTE), class="power.htest")
}

>>もう統計で悩むのは終わりにしませんか? 

↑1万人以上の医療従事者が購読中

ケースコントロール研究のサンプルサイズ計算の実際

例えば、肺がん。

喫煙者は一般人の2割。

喫煙していると喫煙していない人と比べオッズ比は 5

肺がんのなりやすさ 1 に比べて 5 ということ。

この研究はすでに行われていて十分わかっているので、実施されることはないが、実施するとしたら肺がん、非肺がんともに28人の研究でいい。

> sample.size.case.control(f=0.2, R=5)
Case Control Study Sample Size Calculation
n = 27.97932
Prop exposed in gen pop = 0.2
Assumed Odds Ratio = 5
sig.level = 0.05
power = 0.8
NOTE: n is number in *each* group

例えば、糖質6割、タンパク質2割、脂質2割という食事が、糖尿病を引き起こすことを証明したい。

一般人の8割は糖質6割の糖質過多の食事をしているだろう。

糖尿病になるオッズ比が3とする。

このとき糖尿病患者さんと糖尿病でない人をそれぞれ123人集めればOKという計算だ。

> sample.size.case.control(f=0.8, R=3)
Case Control Study Sample Size Calculation
n = 122.4343
Prop exposed in gen pop = 0.8
Assumed Odds Ratio = 3
sig.level = 0.05
power = 0.8
NOTE: n is number in *each* group

例えば、過重労働と心筋梗塞の研究をしたいとする。

月80時間以上の残業をしているブラックな働かされ方をしている人は全体の1割くらいと想像する。

心筋梗塞を起こすリスクを、オッズ比2と想定する。

このとき、研究に必要なサンプルサイズは心筋梗塞患者さんと心筋梗塞を起こさなかった人それぞれ、283人必要との計算になる。

結構大がかりな研究になることがわかる。

> sample.size.case.control(f=0.1, R=2)
Case Control Study Sample Size Calculation
n = 282.686
Prop exposed in gen pop = 0.1
Assumed Odds Ratio = 2
sig.level = 0.05
power = 0.8
NOTE: n is number in *each* group

ケースコントロール研究のサンプルサイズ計算をエクセルで

エクセルでサンプルサイズ計算ができるようにしてみた。

よければどうぞ。

【疫学】ケースコントロール研究 サンプルサイズ計算 【エクセルでサンプルサイズ】 | TKER SHOP

エクセルファイルの使い方動画。

こちらもよければどうぞ。

まとめ

ケースコントロール研究のサンプルサイズ計算は、一般人口での危険因子曝露割合と想定オッズ比がわかれば計算できる。

網羅的な先行研究のチェックが必須だし、もし研究がおこなわれていなければ、妥当な線を自分で考えねばならない。

いずれにしても、ケースコントロール研究は観察型で、検証試験ではないため、それほど厳密でなくてよい。

参考文献

統計学的にみて必要なサンプル数について

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

リサーチクエスチョン探し?データ分析?論文投稿?、、、で、もう悩まない!

第1章臨床研究ではなぜ統計が必要なのか?計画することの重要性
  • 推定ってどんなことをしているの?
  • 臨床研究を計画するってどういうこと?
  • どうにかして標本平均を母平均に近づけられないか?
第2章:研究目的をどれだけ明確にできるのかが重要
  • データさえあれば解析でどうにかなる、という考え方は間違い
  • 何を明らかにしたいのか? という研究目的が重要
  • 研究目的は4種類に分けられる
  • 統計専門家に相談する上でも研究目的とPICOを明確化しておく
第3章:p値で結果が左右される時代は終わりました
  • アメリカ統計協会(ASA)のp値に関する声明で指摘されていること
  • そうは言っても、本当に有意差がなくてもいいの…?
  • なぜ統計専門家はp値を重要視していないのか
  • 有意差がない時に「有意な傾向があった」といってもいい?
  • 統計を放置してしまうと非常にまずい
第4章:多くの人が統計を苦手にする理由
  • 残念ながら、セミナー受講だけで統計は使えません。
  • インプットだけで統計が使えない理由
  • どうやったら統計の判断力が鍛えられるか?
  • 統計は手段なので正解がないため、最適解を判断する力が必要
第5章:統計を使えるようになるために今日から何をすれば良いか?
  • 論文を読んで統計が使えるようになるための5ステップ
第6章:統計を学ぶために重要な環境
  • 統計の3つの力をバランスよく構築する環境

以下のボタンをクリックして、画面に出てくる指示に従って、必要事項を記入してください。

この記事を書いた人

統計 ER ブログ執筆者

元疫学研究者

統計解析が趣味

コメント

コメント一覧 (1件)

コメントする

目次