R でギブスサンプリングを実施する方法

2018年6月24日2024年10月14日

ギブスサンプリング（ギブス法）を R で実施する方法。

初期値を与えて、何度もサンプリングしていると、だんだんに形になってくる。

＞＞もう統計で悩むのは終わりにしませんか？

↑1万人以上の医療従事者が購読中

ギブスサンプリング用のデータの用意

heikinという名前のデータを入力する。

heikin <- c(6.0,10.0,7.6,3.5,1.4,2.5,5.6,3.0,2.2,5.0,
3.3,7.6,5.8,6.7,2.8,4.8,6.3,5.3,5.4,3.3,
3.4,3.8,3.3,5.7,6.3,8.4,4.6,2.8,7.9,8.9)
mean1 <- mean(heikin)
n <- length(heikin)
mean(heikin)
var(heikin)

heikinデータの平均、分散、サンプルサイズは、以下の通り。

> mean(heikin)
[1] 5.106667
> var(heikin)
[1] 4.766161
> length(heikin)
[1] 30

ギブスサンプリングを行うためのパッケージをインストールする

psclパッケージをインストールする。一回だけ。

install.packages("pscl")

psclパッケージを、呼び出す。

library(pscl)

＞＞もう統計で悩むのは終わりにしませんか？

↑1万人以上の医療従事者が購読中

ギブスサンプリングの事前分布の図示

0.05から10まで、0.05刻みの変数xを作る。

alpha=0.01, beta=0.01の逆ガンマ分布を描く。

これが事前分布。

x <- seq(0.05,10,0.05)
curve(densigamma(x,alpha=0.01, beta=0.01),from=0.05,to=10,lwd=3)

ギブスサンプリングのための条件設定

ここで条件設定。

n0 <- 2*0.01
n0S0 <- 2*0.01
S0 <- n0S0/n0
mu0 <- 5
m0 <- 1/4
m1 <- m0+n
n1 <- n0+n
mu1 <- (n*mean1+m0*mu0)/(m0+n)
Q <- sum((heikin-mean1)^2)
n1S1 <- n0S0+Q+m0*n/(m0+n)*(mean1-mu0)^2

サンプリングのための関数を準備する

分散の事後分布から母分散 $ \sigma^2 $ をサンプリングする関数。

my.sigma2 <- function(mu){
sigma2 <- rigamma(1, alpha=(n1+1)/2, beta=(n1S1+m1*(mu-mu1)^2)/2)
return(sigma2)
}

平均の事後分布から母平均をサンプリングする関数。

my.mu <- function(sigma2){
mu <- rnorm(1, mean=mu1, sd=sqrt(sigma2/m1))
return(mu)
}

モンテカルロ法によるシミュレーション

モンテカルロシミュレーションを実行する。

my.montecarlo <- function(n){
set.seed(20110608)
mu <- 5
new.mu <- 5
sigma2 <- 4
for (i in 1:n){
new.sigma2 <- my.sigma2(new.mu)
sigma2 <- sigma2 + new.sigma2
new.mu <- my.mu(new.sigma2)
mu <- mu + new.mu
}
list("mu"=mu/n, "sigma2"=sigma2/n)
}

10万回サンプリングした結果は以下の通り。

> my.montecarlo(100000)
$`mu`
[1] 5.102863
$sigma2
[1] 4.936363

ギブスサンプリングで得られた事後分布の図示

分散の事後分布を描いてみる。

curve(densigamma(x, alpha=(n1+1)/2, beta=(n1S1+m1*(5.102863-mu1)^2)/2),from=0.01,to=8.0, ylim=c(0,0.4),lwd=3)

サンプリング結果を使って平均の分布を描いてみる。

curve(dnorm(x, mean=mu1, sd=sqrt(4.936363/m1)),from=0,to=10,lwd=3)

まとめ

ギブスサンプリングを参考書籍通りに R で行ってみた。

参考書籍

道具としてのベイズ統計

作者:涌井良幸
日本実業出版社

Amazon

よかったらシェアしてね！

URLをコピーしました！

URLをコピーしました！

リサーチクエスチョン探し？データ分析？論文投稿？、、、で、もう悩まない！

第1章：臨床研究ではなぜ統計が必要なのか？計画することの重要性

推定ってどんなことをしているの？
臨床研究を計画するってどういうこと？
どうにかして標本平均を母平均に近づけられないか？

第2章：研究目的をどれだけ明確にできるのかが重要

データさえあれば解析でどうにかなる、という考え方は間違い
何を明らかにしたいのか？という研究目的が重要
研究目的は4種類に分けられる
統計専門家に相談する上でも研究目的とPICOを明確化しておく

第3章：p値で結果が左右される時代は終わりました

アメリカ統計協会（ASA）のp値に関する声明で指摘されていること
そうは言っても、本当に有意差がなくてもいいの…？
なぜ統計専門家はp値を重要視していないのか
有意差がない時に「有意な傾向があった」といってもいい？
統計を放置してしまうと非常にまずい

第4章：多くの人が統計を苦手にする理由

残念ながら、セミナー受講だけで統計は使えません。
インプットだけで統計が使えない理由
どうやったら統計の判断力が鍛えられるか？
統計は手段なので正解がないため、最適解を判断する力が必要

第5章：統計を使えるようになるために今日から何をすれば良いか？

論文を読んで統計が使えるようになるための5ステップ

第6章：統計を学ぶために重要な環境

統計の3つの力をバランスよく構築する環境

『統計を身につける5つのステップ』を
通常1,650円 → メルマガ登録で無料でプレゼント

以下のボタンをクリックして、画面に出てくる指示に従って、必要事項を記入してください。

~~通常価格：1,650円~~　→　無料でお届け

【無料】統計を使いこなすための秘策を学ぶ

この記事を書いた人

toukei-er

統計 ER ブログ執筆者

元疫学研究者

【無料プレゼント付き】学会発表・論文投稿に必要な統計を最短で学ぶことができる無料メルマガ

R でギブスサンプリングを実施する方法

ギブスサンプリング用のデータの用意

ギブスサンプリングを行うためのパッケージをインストールする

ギブスサンプリングの事前分布の図示

ギブスサンプリングのための条件設定

サンプリングのための関数を準備する

モンテカルロ法によるシミュレーション

ギブスサンプリングで得られた事後分布の図示

まとめ

参考書籍

リサーチクエスチョン探し？データ分析？論文投稿？、、、で、もう悩まない！

『統計を身につける5つのステップ』を
通常1,650円 → メルマガ登録で無料でプレゼント

この記事を書いた人

コメント

コメントするコメントをキャンセル

【無料プレゼント付き】学会発表・論文投稿に必要な統計を最短で学ぶことができる無料メルマガ

R でギブスサンプリングを実施する方法

ギブスサンプリング用のデータの用意

ギブスサンプリングを行うためのパッケージをインストールする

ギブスサンプリングの事前分布の図示

ギブスサンプリングのための条件設定

サンプリングのための関数を準備する

モンテカルロ法によるシミュレーション

ギブスサンプリングで得られた事後分布の図示

まとめ

参考書籍

リサーチクエスチョン探し？データ分析？論文投稿？、、、で、もう悩まない！

『統計を身につける5つのステップ』を通常1,650円 → メルマガ登録で無料でプレゼント

この記事を書いた人

関連記事

コメント

コメントする コメントをキャンセル

『統計を身につける5つのステップ』を
通常1,650円 → メルマガ登録で無料でプレゼント

コメントするコメントをキャンセル