R でクロッパーピアソンの割合の信頼区間を計算する方法

2020年4月23日2024年12月29日

正規分布近似を用いた信頼区間とClopper-Pearson 信頼区間を計算する方法。

＞＞もう統計で悩むのは終わりにしませんか？

↑1万人以上の医療従事者が購読中

割合の区間推定（正規分布近似を用いた簡易的な方法）

割合の分散は、割合をp、サンプルサイズをnとすると、

$$ \frac{p (1 – p)}{n} $$

で計算できる。

標準誤差はその平方根で、

$$ \sqrt{\frac{p (1 – p)}{n}} $$

で計算できる。

割合の区間推定は、以下のように計算できる。

$$ p \pm Z_{\alpha/2} \sqrt{\frac{p (1 – p)}{n}} $$

95%信頼区間を計算するスクリプトにすると以下のようになる。

conf.int <- function (p, n, sig.level=0.05){
  res <- c(-1, 1)*qnorm(sig.level/2, lower.tail=F)*sqrt((p*(1-p)/n))+p
  print(round(c(p=p, conf.int=res),3))
}

サンプルサイズ100で、0.95の95%信頼区間を計算すると、0.907から0.993と計算される。

> conf.int(p=0.95,n=100)
        p conf.int1 conf.int2 
    0.950     0.907     0.993

Clopper-Pearson信頼区間（正確な方法）

Clopper-Pearson法は、F分布を使った方法で、より正確な方法である。

統計ソフトRのスクリプトは以下のようになる。

clopper.pearson <- function (x, n, sig.level=0.05){
  LL <- x/(x+(n-x+1)*qf(sig.level/2, lower.tail=F, 2*(n-x+1), 2*x))
  UL <- (x+1)*qf(sig.level/2, lower.tail=F, 2*(x+1),2*(n-x))/((n-x)+(x+1)*qf(sig.level/2, lower.tail=F, 2*(x+1),2*(n-x)))
  print(round(c(p=x/n, "lower limit"=LL, "upper limit"=UL),3))
}

0.95の95%信頼区間は、0.887から0.984と計算された。

> clopper.pearson(x=95,n=100)
          p lower limit upper limit 
      0.950       0.887       0.984

＞＞もう統計で悩むのは終わりにしませんか？

↑1万人以上の医療従事者が購読中

割合の信頼区間エクセル計算機

エクセルファイルを作成した。

良ければどうぞ。

割合の信頼区間計算機【エクセル計算機】 | TKER SHOP

使い方動画を作成した。

こちらもよければ。

youtu.be

割合の信頼区間計算アプリ

デスクトップアプリはこちら↓

割合の信頼区間計算アプリ【Win 版】

割合の信頼区間計算アプリ【Mac 版】

まとめ

割合の信頼区間を求める方法として、正規近似を用いた簡易的な方法と正確方法Clopper-Pearson法を比較してみた。

使い分けは考えずに、いつも正確な方法が良いと思う。

参考になれば。

参考サイト

参考文献

THE USE OF CONFIDENCE OR FIDUCIAL LIMITS ILLUSTRATED IN THE CASE OF THE BINOMIAL

Approximate is Better than “Exact” for Interval Estimation of Binomial Proportions

Clopper–Pearson interval

よかったらシェアしてね！

URLをコピーしました！

URLをコピーしました！

リサーチクエスチョン探し？データ分析？論文投稿？、、、で、もう悩まない！

第1章：臨床研究ではなぜ統計が必要なのか？計画することの重要性

推定ってどんなことをしているの？
臨床研究を計画するってどういうこと？
どうにかして標本平均を母平均に近づけられないか？

第2章：研究目的をどれだけ明確にできるのかが重要

データさえあれば解析でどうにかなる、という考え方は間違い
何を明らかにしたいのか？という研究目的が重要
研究目的は4種類に分けられる
統計専門家に相談する上でも研究目的とPICOを明確化しておく

第3章：p値で結果が左右される時代は終わりました

アメリカ統計協会（ASA）のp値に関する声明で指摘されていること
そうは言っても、本当に有意差がなくてもいいの…？
なぜ統計専門家はp値を重要視していないのか
有意差がない時に「有意な傾向があった」といってもいい？
統計を放置してしまうと非常にまずい

第4章：多くの人が統計を苦手にする理由

残念ながら、セミナー受講だけで統計は使えません。
インプットだけで統計が使えない理由
どうやったら統計の判断力が鍛えられるか？
統計は手段なので正解がないため、最適解を判断する力が必要

第5章：統計を使えるようになるために今日から何をすれば良いか？

論文を読んで統計が使えるようになるための5ステップ

第6章：統計を学ぶために重要な環境

統計の3つの力をバランスよく構築する環境

『統計を身につける5つのステップ』を
通常1,650円 → メルマガ登録で無料でプレゼント

以下のボタンをクリックして、画面に出てくる指示に従って、必要事項を記入してください。

~~通常価格：1,650円~~　→　無料でお届け

【無料】統計を使いこなすための秘策を学ぶ

この記事を書いた人

toukei-er

統計 ER ブログ執筆者

元疫学研究者

コメント一覧（2件）

poecilia8 より:

2022年9月2日 10:31 AM

信頼区間の幅は異ならなかったと書かれていますが、clopper pearsonのほうが0.0011広がっていると思います。

返信
toukeier より:

2022年9月2日 6:54 PM

そうですね。ご指摘ありがとうございます。大きくは異ならなかったとしました。

返信

【無料プレゼント付き】学会発表・論文投稿に必要な統計を最短で学ぶことができる無料メルマガ

R でクロッパーピアソンの割合の信頼区間を計算する方法

割合の区間推定（正規分布近似を用いた簡易的な方法）

Clopper-Pearson信頼区間（正確な方法）

割合の信頼区間エクセル計算機

割合の信頼区間計算アプリ

まとめ

参考サイト

参考文献

リサーチクエスチョン探し？データ分析？論文投稿？、、、で、もう悩まない！

『統計を身につける5つのステップ』を
通常1,650円 → メルマガ登録で無料でプレゼント

この記事を書いた人

コメント

コメント一覧（2件）

コメントするコメントをキャンセル

【無料プレゼント付き】学会発表・論文投稿に必要な統計を最短で学ぶことができる無料メルマガ

R で クロッパーピアソンの割合の信頼区間を計算する方法

割合の区間推定（正規分布近似を用いた簡易的な方法）

Clopper-Pearson信頼区間（正確な方法）

割合の信頼区間エクセル計算機

割合の信頼区間計算アプリ

まとめ

参考サイト

参考文献

リサーチクエスチョン探し？データ分析？論文投稿？、、、で、もう悩まない！

『統計を身につける5つのステップ』を通常1,650円 → メルマガ登録で無料でプレゼント

この記事を書いた人

関連記事

コメント

コメント一覧 （2件）

コメントする コメントをキャンセル

R でクロッパーピアソンの割合の信頼区間を計算する方法

『統計を身につける5つのステップ』を
通常1,650円 → メルマガ登録で無料でプレゼント

コメント一覧（2件）

コメントするコメントをキャンセル