EZR でポアソン回帰分析を行う方法

2023年6月14日2025年1月18日

ポアソン回帰を EZR で行う方法の解説

＞＞もう統計で悩むのは終わりにしませんか？

↑1万人以上の医療従事者が購読中

ポアソン回帰・ポアソン分布とは

ポアソン回帰とは、まれにしか起こらない現象を数えたカウントデータを目的変数にした回帰分析のこと

カウントデータがポアソン分布に従うと仮定している

平均 $ \lambda $ 回起こる事象が、$ X $ 回起こる確率分布がポアソン分布である

そのときに、ある事象が $ k $ 回起こる確率 $ P(X = k) $ は以下のように書ける

$$ \displaystyle P(X = k) = \frac{e^{-\lambda} \lambda^k}{k!} $$

例えば、$ \lambda = 3 $, $ k = 0, 1, 2, \cdots, 10 $ のときのグラフは以下のようになる

上記グラフの R スクリプトは以下のとおり

### Graph of Poisson Distribution
lambda <- 3
k <- 0:10
P <- exp(-lambda)*lambda^k / factorial(k)
plot(k, P, type='h')
library(ggplot2)
ggplot(data=data.frame(k,P), aes(x=k, y=P))+
geom_point(size=3)

サンプルデータの読み込み

以下のサイトから、data3a.csv をダウンロードする

生態学データ解析 – 本/データ解析のための統計モデリング入門

CSV を読み込むメニューを使って、読み込み

data3a というデータセット名にして、読み込む

カウントデータのアウトカム y と、連続データの x、カテゴリカルデータの f の 3 つのデータ含まれることがわかる

f が、chr（文字型）で認識されているので、因子型に変更しておく

すべての文字変数を因子に変換メニューを使って、変換する

Factor という表記に変わった

カテゴリカルデータは、この因子型でないと、統計解析に使えないので注意

＞＞もう統計で悩むのは終わりにしませんか？

↑1万人以上の医療従事者が購読中

データの図示

グラフと表の散布図メニューを使って、f の群別の散布図を書いてみる

今回は、線形回帰分析ではないので、回帰直線に目を奪われないために、最小 2 乗直線（回帰直線）のオプションは外しておくほうがよい

散布図は以下のとおりだ

ポアソン回帰のあてはめ（連続データ）

このデータにポアソン回帰をあてはめてみる

まずは、x で y を予測（説明）できるかという計算

標準メニュー → 統計量 → モデルへの適合 → 一般化線型モデルを選択

目的変数に y、説明変数に x、リンク関数族は、poisson（ポアソン）をダブルクリックして選択、リンク関数は自動で log が選ばれた状態になるのでそのまま

このように設定する

OK をクリックすると計算される

x が 1 上昇するごとに、対数カウントが、0.07566 上昇するという計算結果で、統計学的有意（検定の名前は Wald 検定）

対数カウント上昇を真数カウントに直すと、x が 1 上昇するごとに約 1.08 倍のべき乗（$ e^{1.08 x} $）になるという計算になる

ポアソン回帰のあてはめ（カテゴリカルデータ）

変数 f （カテゴリカルデータ）を説明変数にするとどうなるか

メニュー内の設定は以下のとおり

説明変数の部分だけ、x から f に変えた

結果は、以下のとおり

f の C と比較して、T の係数推定値 0.01277 が計算されている

統計学的有意ではない

ポアソン回帰のあてはめ（連続データ＋カテゴリカルデータ）

では、変数 x と f をともに説明変数としたらどうだろうか

f の C と T の差を見たいときに、x が交絡因子で、調整しないといけないという状況と考えて計算してみる

ちなみに、C と T では、x の値が異なっており、交絡因子

y の予後因子、かつ、
f と関連あり、かつ、
f と y の中間因子ではない

とみなせる変数である

説明変数の設定は以下のとおり、x と f を + でつなぐ

結果は以下のとおり

やはり T は統計学的有意ではなかった

なので、C と T の群間差は、明確ではなかったと言える

最初のほうで書いたグラフでも、C と T の差は明瞭ではなかったので、図の印象と符合している

まとめ

ポアソン回帰・ポアソン分布について簡単に解説して、EZR での解析方法を解説した

参考になれば

参考サイト

13-3. ポアソン分布 | 統計学の時間 | 統計WEB

参考書籍

データ解析のための統計モデリング入門――一般化線形モデル・階層ベイズモデル・MCMC (確率と情報の科学)

よかったらシェアしてね！

URLをコピーしました！

URLをコピーしました！

リサーチクエスチョン探し？データ分析？論文投稿？、、、で、もう悩まない！

第1章：臨床研究ではなぜ統計が必要なのか？計画することの重要性

推定ってどんなことをしているの？
臨床研究を計画するってどういうこと？
どうにかして標本平均を母平均に近づけられないか？

第2章：研究目的をどれだけ明確にできるのかが重要

データさえあれば解析でどうにかなる、という考え方は間違い
何を明らかにしたいのか？という研究目的が重要
研究目的は4種類に分けられる
統計専門家に相談する上でも研究目的とPICOを明確化しておく

第3章：p値で結果が左右される時代は終わりました

アメリカ統計協会（ASA）のp値に関する声明で指摘されていること
そうは言っても、本当に有意差がなくてもいいの…？
なぜ統計専門家はp値を重要視していないのか
有意差がない時に「有意な傾向があった」といってもいい？
統計を放置してしまうと非常にまずい

第4章：多くの人が統計を苦手にする理由

残念ながら、セミナー受講だけで統計は使えません。
インプットだけで統計が使えない理由
どうやったら統計の判断力が鍛えられるか？
統計は手段なので正解がないため、最適解を判断する力が必要

第5章：統計を使えるようになるために今日から何をすれば良いか？

論文を読んで統計が使えるようになるための5ステップ

第6章：統計を学ぶために重要な環境

統計の3つの力をバランスよく構築する環境

『統計を身につける5つのステップ』を
通常1,650円 → メルマガ登録で無料でプレゼント

以下のボタンをクリックして、画面に出てくる指示に従って、必要事項を記入してください。

~~通常価格：1,650円~~　→　無料でお届け

【無料】統計を使いこなすための秘策を学ぶ

この記事を書いた人

toukei-er

統計 ER ブログ執筆者

元疫学研究者

コメント一覧（1件）

R でポアソン回帰の 95 ％信頼区間付き回帰直線のグラフを描く方法 – 統計ER より:

2024年8月29日 9:02 PM

[…] EZR でポアソン回帰分析を行う方法ポアソン回帰を EZR で行う方法の解説ポアソン回帰・ポアソン分布とは […]

返信

【無料プレゼント付き】学会発表・論文投稿に必要な統計を最短で学ぶことができる無料メルマガ

EZR でポアソン回帰分析を行う方法

ポアソン回帰・ポアソン分布とは

サンプルデータの読み込み

データの図示

ポアソン回帰のあてはめ（連続データ）

ポアソン回帰のあてはめ（カテゴリカルデータ）

ポアソン回帰のあてはめ（連続データ＋カテゴリカルデータ）

まとめ

参考サイト

参考書籍

リサーチクエスチョン探し？データ分析？論文投稿？、、、で、もう悩まない！

『統計を身につける5つのステップ』を
通常1,650円 → メルマガ登録で無料でプレゼント

この記事を書いた人

コメント

コメント一覧（1件）

コメントするコメントをキャンセル

【無料プレゼント付き】学会発表・論文投稿に必要な統計を最短で学ぶことができる無料メルマガ

EZR でポアソン回帰分析を行う方法

ポアソン回帰・ポアソン分布とは

サンプルデータの読み込み

データの図示

ポアソン回帰のあてはめ（連続データ）

ポアソン回帰のあてはめ（カテゴリカルデータ）

ポアソン回帰のあてはめ（連続データ＋カテゴリカルデータ）

まとめ

参考サイト

参考書籍

リサーチクエスチョン探し？データ分析？論文投稿？、、、で、もう悩まない！

『統計を身につける5つのステップ』を通常1,650円 → メルマガ登録で無料でプレゼント

この記事を書いた人

関連記事

コメント

コメント一覧 （1件）

コメントする コメントをキャンセル

『統計を身につける5つのステップ』を
通常1,650円 → メルマガ登録で無料でプレゼント

コメント一覧（1件）

コメントするコメントをキャンセル