この記事では「時間依存性共変量を考慮したCox比例ハザードモデルとは?EZRでの実施例も解説!」としてわかりやすく解説します。
- 時間依存性共変量とは?どんな例がある?
- 時間依存性共変量を考慮したCox比例ハザードモデルの例
- 時間依存性共変量を考慮したCox比例ハザードモデルをEZRで実施する
理解できるようになります。
ぜひご覧くださいませ!
時間依存性共変量とは?どんな例がある?
時間依存性共変量を理解する前に、まずは通常の共変量に関して整理しましょう!
通常の共変量はどんな前提を持っている?
通常、共変量(説明変数)というのは、背景因子の何かであることが一般的ですね。
その共変量に関して、どんな前提を持っているかというと、以下の3つのうちどれか。
- ベースライン(研究開始時点)から変わらない前提
- 変わったとしても、全員一律変わる
- 変わったとしてもランダムに発生するから、群間比較の上では無視可能
1つ目の「ベースライン(研究開始時点)から変わらない前提」ですが、これは例えば性別や成人における身長。
性別は研究期間中に変わることは考えられませんし、成人であれば身長が大幅に伸びるということも考えられません。
2つ目の「変わったとしても、全員一律変わる」に関しては、例えば年齢。
どんな人でも1年で1歳分だけ歳をとりますので、それなら共変量としては特に考える必要はありません。
3つ目の「変わったとしてもランダムに発生するから、群間比較の上では無視可能」というのは、例えば体重や血圧の増減。
例えば研究の期間が1年だったとして、1年もあれば体重や血圧は変動する可能性はあります。
しかし、それは群間で偏った増減ではなく、どの群でもランダムに起こりうる増減であれば、群間比較をする上では無視可能。
だから、ベースラインの1点のみ考えればOK、という考え方です。
時間依存性の共変量とは?
では時間依存性の共変量とはどんなものでしょうか。
それは、通常の共変量の考え方がどうしてもできない共変量のこと。
つまり、「研究期間中に全員が一律変化するわけではない」し「ランダムに変わるわけではなく、その変化がアウトカムに著しく影響を及ぼす」という共変量です。
一言で言えば「アウトカムに影響を与える因子が時間とともに変化する」時に、その因子は時間依存性の共変量といえます。
後述する論文では、「ニルマトレルビル治療を受けたかどうか」というのが時間依存的に変化し、その変化を解析上考慮したい、という目的を持っています。
時間依存性共変量を考慮したCox比例ハザードモデルの例
では、実際に時間依存性共変量を考慮したCox比例ハザードモデルの例を見てみましょう。
こちらの論文では、時間依存性共変量を考慮したCox比例ハザードモデルが使われています。
(引用:https://www.nejm.org/doi/full/10.1056/NEJMoa2204919)
下記の通り、ニルマトレルビル治療の有無が研究期間中に変化してしまう状況、ということです。
結果の解釈などは原著を見ていただければと思いますが、通常のCox比例ハザードモデルの解釈の仕方で問題ありません。
時間依存性共変量を考慮したCox比例ハザードモデルをEZRで実施する
では最後に、時間依存性共変量を考慮したCox比例ハザードモデルをEZRで実施する方法をお伝えします。
どこで実施できるかというと、「統計解析 > 生存期間の解析 >時間依存性変数を含む生存期間に対する多変量解析(Cox比例ハザード回帰)」です。
解析をする上で、通常のCox比例ハザードモデルをEZRで実施する場合と同じ点と異なる点を把握しておきましょう。
青で囲んだ部分は、通常のCox比例ハザードモデルをEZRで実施する場合と同じ点です。
一方で、赤で囲んだ部分が、時間依存性共変量を考慮したCox比例ハザードモデルで独特の指定場所になります。
EZRで時間依存性共変量を考慮したCox比例ハザードモデルを実施するためのデータの作りかた
じゃあこの赤で囲んだ部分を指定するには、データの中に「時間依存性変数が変わるまでの時間」を追加する必要があるということです。
ここからは書籍「EZRでやさしく学ぶ医療統計」に付与されるデモデータを用いて解説するのですが、下記の図の通り「時間依存性変数が変わるまでの時間」をデータに付与します。
実際のデータを見ると、下記の通り。
DaysHCが「イベントまでの時間」ですが、それの他にDaysGVHD24という「時間依存性変数が変わるまでの時間」がデータに付与されていることがわかります。
時間依存性変数が研究期間中に変わる場合には「イベントまでの時間」と「時間依存性変数が変わるまでの時間」が異なりますが、時間依存性変数が変わらない症例は二つの時間は一致します。
実際にEZRで時間依存性共変量を考慮したCox比例ハザードモデルを実施する
ではデータが用意できたら、解析を実施します。
「統計解析 > 生存期間の解析 >時間依存性変数を含む生存期間に対する多変量解析(Cox比例ハザード回帰)」を選択。
下記の通り、上の部分にはイベントの有無と、イベントまでの時間を指定します。
そして、時間依存性変数が変わるまでの時間を、下の方で指定します。
この状態でOKを押すと、解析結果が出力されます。
この結果から、急性移植片対宿主病(GVHD)なしより、急性移植片対宿主病(GVHD)ありの方が イベント(出血性膀胱炎)が発症しやすい、ということが言えます。
EZRで時間依存性共変量を考慮したCox比例ハザードモデルを実施した時にEZRが解析プロセスでやっていること
上記の通り、EZRを用いることで、簡単に時間依存性共変量を考慮したCox比例ハザードモデルを実施することができました。
でも、解析のプロセスがちょっとブラックボックスな感じがして「本当に大丈夫?」という、何となくのモヤモヤがある方もいるかもしれません。
そのため、ここからはEZRが解析プロセスの中でやっていることを解説しますね。
実は、時間依存性変数を含む生存期間に対する多変量解析(Cox比例ハザード回帰)を実施するとTempTDというデータが作られることがわかります。
そのTempTDを見てみると、以下のように時間依存性の共変量が変わった症例は、2行になっていることがわかります。
そして、新たに「Start日(変数名:start_td)」「Stop日(変数名:stop_td)」「共変量が0か1か(変数名:DaysGVHD24_td)」という3つの変数が作成されていることがわかります。
そして、EZRの出力でRのプログラムを見ると、Start日とStop日を考慮してCox回帰を実施していることがわかります。
そして、説明変数には新たに作成された「共変量が0か1か(変数名:DaysGVHD24_td)」が指定されています。
そのため、EZRでは解析プロセスとして「Start日(変数名:start_td)」「Stop日(変数名:stop_td)」「共変量が0か1か(変数名:DaysGVHD24_td)」という3つの変数を作成し、これらを考慮してCox回帰を実施していることがわかります。
まとめ
いかがでしたか?
この記事では「時間依存性共変量を考慮したCox比例ハザードモデルとは?EZRでの実施例も解説!」としてわかりやすく解説しました。
- 時間依存性共変量とは?どんな例がある?
- 時間依存性共変量を考慮したCox比例ハザードモデルの例
- 時間依存性共変量を考慮したCox比例ハザードモデルをEZRで実施する
を理解していただけたのなら嬉しいです!
こちらの内容は動画でも解説しておりますので、併せてご確認くださいませ。
コメント