R で罹患率比を求める方法

2018年8月31日2024年10月13日

罹患率比の計算は、どうやるのか？

R での計算の方法。

＞＞もう統計で悩むのは終わりにしませんか？

↑1万人以上の医療従事者が購読中

罹患・罹患率・罹患率比とは？

罹患（りかん）とは？

罹患とは病気にかかること。

病気にかかったことは、診断によってわかる場合と、発症によってわかる場合がある。

診断とは、外来の診察で下される場合や、血液検査の結果や、CTやMRIの結果で判断される場合などがある。

発症とは症状が出ること。

冷や汗が出るほど胸痛が起きて数十分続いたとか、ろれつが回らなくなり、手足が麻痺したとか。

罹患率とは？

率は速さを言う。

ある人が何年間かのうちに罹患したという情報を集めて集計する。

$$ \frac{罹患人数}{全体人数 \times 一人ひとりの観察年数} $$

と計算する。

分母は人年（じんねん or にんねん）。

研究タイプが「観察」研究なので、観察人年と呼ばれる。

罹患率比とは？

それでは、罹患率比とは？

罹患率比は、罹患率の比のこと。

例えば、生活習慣Aを持っているグループと生活習慣Aを持っていないグループの比をとる、ということ。

罹患率比は何のために計算するのか？

罹患率比は、生活習慣Aを持っているグループが生活習慣Aを持っていないグループに比べて、どのくらい罹患しやすいかの指標になるから。

生活習慣Aを持っているグループが罹患率10だとして、生活習慣Aを持っていないグループが罹患率5だとすると、10÷5で罹患率比は2。

罹患率比2の意味は、「生活習慣Aを持っているグループは、生活習慣Aを持っていないグループに比べて、2倍罹患しやすい」。

この結果からは、「もし生活習慣Aを持っている人が、生活習慣Aをやめたら、罹患しやすさが半分になるかもしれない」と解釈できる。

罹患率比は、生活習慣Aなど、罹患を規定している要因を見つけて、比の大きさ＝その要因の関連性の強さから、対策をとる重要なリスクファクターかどうかを見極めるために有用な指標なのだ。

＞＞もう統計で悩むのは終わりにしませんか？

↑1万人以上の医療従事者が購読中

Rで罹患率比はどうやって計算するのか？

Rでは、epitoolsパッケージのrateratio()を使って、簡単に計算することができる。

まず最初一回だけパッケージのインストール。

install.packages("epitools")

epitoolsパッケージを呼び出す。

library(epitools)

ある要因への曝露なしグループの罹患人数が15人、

ある要因への曝露ありグループの罹患人数が41人、

曝露なしグループの観察人年が19017人年、

曝露ありグループの観察人年が28010人年。

bc <- c(Unexposed = 15, Exposed = 41)
pyears <- c(Unexposed = 19017, Exposed = 28010)
dd <- matrix(c(41,15,28010,19017),2,2)
dimnames(dd) <- list(Exposure=c("Yes","No"), Outcome=c("BC","PYears"))

計算結果は以下のとおり。

> dd
Outcome
Exposure BC PYears
Yes 41  28010
No  15  19017

罹患率比の計算をする。

rateratio(bc,pyears)

結果は以下のように出力される。

> rateratio(bc,pyears)
$data
          bc pyears
Unexposed 15  19017
Exposed   41  28010
Total     56  47027

$measure
                        NA
rate ratio with 95% C.I. estimate    lower    upper
               Unexposed 1.000000       NA       NA
               Exposed   1.842977 1.041036 3.449052

$p.value
           Outcome
Predictor   midp.exact       wald
  Unexposed         NA         NA
  Exposed   0.03545742 0.03736289

attr(,"method")
[1] "Median unbiased estimate & mid-p exact CI"

罹患率比は1.842977と計算される。

曝露ありグループは、曝露なしグループの1.8倍罹患しやすいという結果。

罹患率比は、点推定値でもある。

区間推定すると、95％信頼区間は、1.041036 から 3.449052 という区間で推定される。

ちなみに、95%信頼区間の意味合いは、今回と同じような区間推定を100回行った時に、95回は、母集団の点推定値を含んでいる区間のことである。

95%信頼区間の下限が、1を超えているので、罹患率比 1.842977 は統計学的有意に、1 とは異なると言える。

p値も0.03545742と、0.05未満で、統計学的有意と言える。

まとめ

罹患とは、病気にかかること。

罹患率とは、観察人年で罹患人数を割った、罹患しやすさ（速度）のこと。

罹患率比とは、罹患率同士の比で、ある要因ありの要因なしに対する相対的な罹患しやすさのこと。

Rではepitoolsパッケージを使って罹患率比が計算できる。

参考になれば。

よかったらシェアしてね！

URLをコピーしました！

URLをコピーしました！

リサーチクエスチョン探し？データ分析？論文投稿？、、、で、もう悩まない！

第1章：臨床研究ではなぜ統計が必要なのか？計画することの重要性

推定ってどんなことをしているの？
臨床研究を計画するってどういうこと？
どうにかして標本平均を母平均に近づけられないか？

第2章：研究目的をどれだけ明確にできるのかが重要

データさえあれば解析でどうにかなる、という考え方は間違い
何を明らかにしたいのか？という研究目的が重要
研究目的は4種類に分けられる
統計専門家に相談する上でも研究目的とPICOを明確化しておく

第3章：p値で結果が左右される時代は終わりました

アメリカ統計協会（ASA）のp値に関する声明で指摘されていること
そうは言っても、本当に有意差がなくてもいいの…？
なぜ統計専門家はp値を重要視していないのか
有意差がない時に「有意な傾向があった」といってもいい？
統計を放置してしまうと非常にまずい

第4章：多くの人が統計を苦手にする理由

残念ながら、セミナー受講だけで統計は使えません。
インプットだけで統計が使えない理由
どうやったら統計の判断力が鍛えられるか？
統計は手段なので正解がないため、最適解を判断する力が必要

第5章：統計を使えるようになるために今日から何をすれば良いか？

論文を読んで統計が使えるようになるための5ステップ

第6章：統計を学ぶために重要な環境

統計の3つの力をバランスよく構築する環境

『統計を身につける5つのステップ』を
通常1,650円 → メルマガ登録で無料でプレゼント

以下のボタンをクリックして、画面に出てくる指示に従って、必要事項を記入してください。

~~通常価格：1,650円~~　→　無料でお届け

【無料】統計を使いこなすための秘策を学ぶ

この記事を書いた人

toukei-er

統計 ER ブログ執筆者

元疫学研究者

【無料プレゼント付き】学会発表・論文投稿に必要な統計を最短で学ぶことができる無料メルマガ

R で罹患率比を求める方法

罹患・罹患率・罹患率比とは？

罹患（りかん）とは？

罹患率とは？

罹患率比とは？

罹患率比は何のために計算するのか？

Rで罹患率比はどうやって計算するのか？

まとめ

リサーチクエスチョン探し？データ分析？論文投稿？、、、で、もう悩まない！

『統計を身につける5つのステップ』を
通常1,650円 → メルマガ登録で無料でプレゼント

この記事を書いた人

コメント

コメントするコメントをキャンセル

【無料プレゼント付き】学会発表・論文投稿に必要な統計を最短で学ぶことができる無料メルマガ

R で罹患率比を求める方法

罹患・罹患率・罹患率比とは？

罹患（りかん）とは？

罹患率とは？

罹患率比とは？

罹患率比は何のために計算するのか？

Rで罹患率比はどうやって計算するのか？

まとめ

リサーチクエスチョン探し？データ分析？論文投稿？、、、で、もう悩まない！

『統計を身につける5つのステップ』を通常1,650円 → メルマガ登録で無料でプレゼント

この記事を書いた人

関連記事

コメント

コメントする コメントをキャンセル

『統計を身につける5つのステップ』を
通常1,650円 → メルマガ登録で無料でプレゼント

コメントするコメントをキャンセル