混合モデルにおけるランダム切片の話

2022年8月21日2024年9月21日

繰り返し計測された連続データを適切に扱うために必要な線形混合モデル。

ランダム切片モデルが一番単純で有名だが、その切片はどんなふうになっているか。

＞＞もう統計で悩むのは終わりにしませんか？

↑1万人以上の医療従事者が購読中

通常の線形モデルの切片はどんな計算になっているか？

例えば、連続データ CDratio1 を 3 群のFCZで予測する線形モデルの場合、以下のような結果になる。

このときCDratio1の予測値 $ \hat{Y} $ は、以下の式で書ける。

$$ \hat{Y} = 160.10 + (-8.39) X_{FCZ 100-200} + (-2.35) X_{FCZ 400} $$

$ X_{FCZ 100-200} $、$ X_{FCZ 400} $ は、それぞれのカテゴリを表すダミー変数である。どちらもゼロの場合は、FCZ 0群を表す。

この式から、それぞれの群の予測値が、それぞれの群の平均値に一致していることが確認できる。

FCZ 0: 160.10
FCZ 100-200: 160.10 – 8.39 = 151.71
FCZ 400: 160.10 – 2.34 = 157.76

各群の平均値の集計値は以下の通り同じである。

上記表内は、平均値（標準偏差）で集計値が表示されている。

線形混合モデルの切片はどんな計算になっているか？

では、繰り返し測定の線形混合モデルの場合、切片はどんな値になるのだろうか？

CDratioは、週ごとに３回の繰り返し測定した値で、それをFCZの３群で比較する線形混合モデルを考える。

３回の繰り返しは隔週なので、Weeksという変数にする。

線形混合モデルの解析結果は以下のとおりである。

切片（Intercept）を見ると、160.669となっていて、線形モデルの 160.10 とは異なる。

FCZ のうち、FCZ 0は結果に登場してきていないカテゴリ。

Weeks のうち、CDratio1 が結果に登場してきていないカテゴリ。

基準カテゴリ FCZ 0 かつ CDratio1 の平均は、上記の計算では切片で、160.10 であった。

つまり、この計算結果の切片は 160.10 ではないのか？という疑問が生じるわけだ。

しかしそうではない。

これは３回繰り返し測定している各個人特有の切片、ランダム切片が加味されているからである。

線形混合モデルの解析結果であるアクティブモデルを選択しておき、EZRの標準メニューのモデル→計算結果をデータとして保存を使って、予測値を計算し、保存する。

fitted.LMM.X （今回の場合はXは６）という変数が増える。

アクティブモデルにranef() 関数を実行する。

ranef(LMM.6)

これは被験者ごとの切片、すなわちランダム切片を出力してくれる。

WeeksがCDratio1のデータだけ残し、ランダム切片をcbindで結合して保存する。

1件、欠損値のせいか、ランダム切片が計算できていなかった症例があり、それは除いた。

X.Intercept. がランダム切片（被験者ごとの切片）である。

最後に、FCZ 0群だけ残し、fitted.LMM.6 から X.Intercept. を引くと、すべて同じ160.6686と計算される。

これが固定効果の切片 160.669である。

こういう関係性になっている。

なので、FCZ 0で、CDratio1という全体平均のグループであっても、一人ひとり別々の切片（ランダム切片）を持っていて、それが加味されているので、固定切片は FCZ 0 かつ CDratio1 の平均というわけではないということだ。

＞＞もう統計で悩むのは終わりにしませんか？

↑1万人以上の医療従事者が購読中

まとめ

線形混合モデルの切片について、ランダム切片の存在を明確にし、線形モデルの切片との比較をしながら、その違いについて紹介した。

参考サイト

経時測定データの解析

リサーチクエスチョン探し？データ分析？論文投稿？、、、で、もう悩まない！

第1章：臨床研究ではなぜ統計が必要なのか？計画することの重要性

推定ってどんなことをしているの？
臨床研究を計画するってどういうこと？
どうにかして標本平均を母平均に近づけられないか？

第2章：研究目的をどれだけ明確にできるのかが重要

データさえあれば解析でどうにかなる、という考え方は間違い
何を明らかにしたいのか？という研究目的が重要
研究目的は4種類に分けられる
統計専門家に相談する上でも研究目的とPICOを明確化しておく

第3章：p値で結果が左右される時代は終わりました

アメリカ統計協会（ASA）のp値に関する声明で指摘されていること
そうは言っても、本当に有意差がなくてもいいの…？
なぜ統計専門家はp値を重要視していないのか
有意差がない時に「有意な傾向があった」といってもいい？
統計を放置してしまうと非常にまずい

第4章：多くの人が統計を苦手にする理由

残念ながら、セミナー受講だけで統計は使えません。
インプットだけで統計が使えない理由
どうやったら統計の判断力が鍛えられるか？
統計は手段なので正解がないため、最適解を判断する力が必要

第5章：統計を使えるようになるために今日から何をすれば良いか？

論文を読んで統計が使えるようになるための5ステップ

第6章：統計を学ぶために重要な環境

統計の3つの力をバランスよく構築する環境

『統計を身につける5つのステップ』を
通常1,650円 → メルマガ登録で無料でプレゼント

以下のボタンをクリックして、画面に出てくる指示に従って、必要事項を記入してください。

~~通常価格：1,650円~~　→　無料でお届け

【無料】統計を使いこなすための秘策を学ぶ

この記事を書いた人

toukei-er

統計 ER ブログ執筆者

元疫学研究者

【無料プレゼント付き】学会発表・論文投稿に必要な統計を最短で学ぶことができる無料メルマガ

混合モデルにおけるランダム切片の話

通常の線形モデルの切片はどんな計算になっているか？

線形混合モデルの切片はどんな計算になっているか？

まとめ

参考サイト

おすすめ書籍

リサーチクエスチョン探し？データ分析？論文投稿？、、、で、もう悩まない！

『統計を身につける5つのステップ』を
通常1,650円 → メルマガ登録で無料でプレゼント

この記事を書いた人

コメント

コメントするコメントをキャンセル

【無料プレゼント付き】学会発表・論文投稿に必要な統計を最短で学ぶことができる無料メルマガ

混合モデルにおけるランダム切片の話

通常の線形モデルの切片はどんな計算になっているか？

線形混合モデルの切片はどんな計算になっているか？

まとめ

参考サイト

おすすめ書籍

リサーチクエスチョン探し？データ分析？論文投稿？、、、で、もう悩まない！

『統計を身につける5つのステップ』を通常1,650円 → メルマガ登録で無料でプレゼント

この記事を書いた人

関連記事

コメント

コメントする コメントをキャンセル

『統計を身につける5つのステップ』を
通常1,650円 → メルマガ登録で無料でプレゼント

コメントするコメントをキャンセル