この記事では「競合リスクとGray検定とは?打ち切りとして扱うことの問題点」ということでお伝えしていきます。
生存時間解析を学ぶと「競合リスク」という用語にぶつかることがあります。
- 競合リスクってそもそも何?
- 競合リスクがある場合の解決策3つ
- 競合リスクを考慮した解析であるGray検定をEZRで実践してみる
ということを理解できるようになりますよ!
競合リスクとは?
まずは競合リスクについて理解しておきましょう。
競合リスクの定義とは以下の通り。
…わかるようでわからないような、、という感じかもしれないですね。
例を挙げて競合リスクを見てみましょう。
競合リスクの例
競合リスクの例としてよく用いられるのは「がんの増悪」と「増悪前の死亡」です。
ある研究において「がんの増悪」をイベントとして研究を実施したとします。
研究に組み入れられた被験者さんの中には、「がんが増悪する前に死亡」する方も出てくる可能性はありますよね。
もし「がんが増悪する前に死亡」してしまった場合、本当に見たい「がんの増悪」というイベントは未来永劫、観察できないことになります。
逆もまた然りで、「がんの増悪」というイベントが起こった場合に、「がんが増悪する前に死亡」というイベントは起こらないはず。
上記の場合、一方のイベントが起こると他方のイベントが観測できない、という関係が成り立つので、「がんの増悪」と「がんが増悪する前に死亡」というイベントは、互いに競合しているイベントである、と言えます。
このような場合に、競合リスクと呼んでいるのです。
競合リスクがあったときにどうすればいい?
では、競合リスクがあった場合にどうすればいいのでしょうか?
解決策としては3つ考えることができます。
- 興味あるイベント以外は打ち切りにする
- 興味あるイベントの定義を再考する
- 競合リスクを考慮した解析をする
それぞれ詳しくみていきましょう。
競合リスクがある場合の解決策1:興味あるイベント以外は打ち切りにする
これはもっともシンプルな方法ですね。
興味あるイベントが「がんの増悪」である場合、それ以外は全て打ち切りにする、という解決策です。
いわゆる、通常の生存時間解析として考える、ということ。
ただしこの解決策には一つだけ問題点があります。
それは「打ち切り」の定義。
通常の打ち切りが意味するところは「追跡できたところまではイベントが起きていない」ということであり、これは暗に「今後イベントが起こりうる可能性はある」ということを含んでいます。
例えば、試験期間が終了する時点で「がんの増悪」がみられなかった場合、試験終了まではがんの増悪はみられなかったけど、その後も追跡できるのであればイベントが観察できる可能性はあります。
しかし、増悪前の死亡を打ち切りにした場合、今後「がんの増悪」というイベントは絶対に起こらないですよね。
この矛盾が問題点となります。
競合リスクがある場合の解決策2:興味あるイベントを再考する
競合リスクがある場合の解決策2つ目は、興味あるイベントを再考することです。
例えば、「がんの増悪もしくは死亡のどちらか早い方」をイベントとする場合、上記の競合リスクの問題は解消されます。
そのため、通常の生存時間解析を適用することで問題はなくなります。
ただし、イベントを変えるということは試験の目的も変わる、ということですので、慎重に考える必要があります。
競合リスクがある場合の解決策3:競合リスクを考慮した解析を実施する
競合リスクがある場合の解決策3つ目は、競合リスクを考慮した解析を実施すること。
つまり、「増悪前に死亡」した方は「がんの増悪」が起こらないとして扱いながら、解析をするということです。
この解析方法がGray検定として知られています。
Fine & Gray検定は競合リスクを考慮して、注目したいイベントの群間比較ができる解析。
例えば、
- 注目したいイベント:がんの増悪
- 競合リスク:死亡
だったときに、死亡を考慮して、がんの増悪の群間比較ができる解析なんです。
このGray検定を実際にやってみる方法を次に紹介しますね。
競合リスクを考慮した解析:Gray検定をEZRで実践してみる
では、競合リスクを考慮した解析であるGray検定をEZRで実践してみましょう。
データは「EZRでやさしく学ぶ統計学」に付いているデモデータを用います。
状況としては、あるがん腫において
- なんのイベントも起きていない:0
- 腫瘍の増悪:1
- 増悪せずに死亡:2
というデータになっていて、解析の目的は「増悪せずに死亡という競合リスクを考慮しながら腫瘍の増悪に対して群間比較をしたい」ということです。
Gray検定を実施する際に重要なのは、データの作り方。
以下のように、「打ち切り:0」「目的とするイベント:1」「競合するイベント:2」としてデータを作る必要があります。
他のデータ作成は、EZRで生存時間解析を実施する場合と同じで問題ありません。
EZRでGray検定を実施する
データができたところで、実際にGray検定を実施してみましょう。
「統計解析」>「生存期間の解析」>「累積発生率(競合イベントを含む)の記述と群間の比較(Gray検定)」を選択。
下記のような画面になるので、
- 観察期間の変数(1つ選択)には、生存期間の列を選択
- イベント(1,2,3…)、打ち切り(0)の変数(1つ選択)には、上記の注意点のように「打ち切り:0」「目的とするイベント:1」「競合するイベント:2」とした列を選択
- 群別する変数を選択(0〜複数選択可)には、群別したい列を選択
すればOKです。
これでOKを押すと、下記のように結果が出力されます。
P値が2つ出ていますが、上はイベントが1(今回の場合、がんの増悪)に対する群間比較結果であり、下はイベントが2(今回の場合、増悪せずに死亡)の群間比較結果を示しています。
どちらの結果に注目すればいいのか?というと、今回の解析の目的は「増悪せずに死亡という競合リスクを考慮しながら腫瘍の増悪に対して群間比較をしたい」ですので、イベントが1(今回の場合、がんの増悪)に対する群間比較結果を参照する必要があります。
まとめ
いかがでしたか?
この記事では「競合リスクとGray検定とは?打ち切りとして扱うことの問題点」ということでお伝えしました。
- 競合リスクってそもそも何?
- 競合リスクがある場合の解決策3つ
- 競合リスクを考慮した解析であるGray検定をEZRで実践してみる
ということが理解できたのなら幸いです!
コメント
コメント一覧 (2件)
EZRで行うGray検定とFine-Grayは別のものだと認識していたのですが、こちらのブログの内容で正しいのでしょうか?
コメントありがとうございます。
Gray検定とFine-Gray回帰は別のため、修正させていただきました。