この記事では「Number at Riskとは統計でどんな意味?累積生存率との関係」ということでお伝えします。
カプランマイヤー曲線の下になんとなく数字がついているのを見たことがあるけど、どんな意味を持っているのかわからない。。。
という方もいらっしゃるのではないでしょうか。
- Number at Riskがどんな意味を持つのか?
- Number at Riskが累積生存率にどう影響を及ぼすのか
ということが理解できるようになりますよ!
Number at Riskとは?どんな意味を持つ?
Number at Riskは、生存時間解析で用いられる用語。
特に、カプランマイヤー曲線の下についている数字です。
例えば、下記のカプランマイヤー曲線でもNumber at Riskが出力されていますね。
Number at Riskは日本語では「リスク人数」と呼ばれていて、その直前の時点までに残っている人数を示しています。
生存時間解析はイベントが起こるまでの時間をアウトカムとします。
その際に、今後イベントを起こすリスクがある人数、という意味ですね。
例えば上記のカプランマイヤー曲線では、500日目のA群のNumber at Riskは19人。
500日目の直前まで、A群では19人が試験に残っている(今後イベントを起こすリスクがある)ということを意味しています。
そして、累積生存率を計算するための分母になる人数でもあります。
これは後ほどまた説明しますね。
Number at Riskから累積生存率はどう計算される?
Number at Riskは累積生存率を計算するための分母になる人数です。
これはどういうことか。
例を用いて考えてみましょう。
Number at Riskが累積生存率に及ぼす影響
以下の3つの状況を見てみます。
試験には3人参加しており、2人はイベントを起こし、1人は打ち切りだった場合、という想定。
打ち切りが発生する状況が違います。
この時に、解析結果がどうなるのか?を考えてみましょう。
状況1での解析結果
まずは状況1での解析結果。
結論から示すと、結果としてはこんな感じになります。
時点1の直前までは3人が参加しているので、Number at Riskは3。
そして、時点1では1名がイベントを起こしているため、残りは2人。
だから2/3の生存率ですね。
この時、分母はNumber at Riskであり、分子はイベントの非発生例、ということになります。
次に時点2。
時点2の直前までは2人が残っているので、Number at Riskは2。(1名は時点1でイベントを起こしているため)
そして、時点2では1名が打ち切りを起こしています。
この時、イベントを起こしている人は0人です。
なので、この時の累積生存率は、2/3*2/2=2/3となります。
それまでの生存率に、時点2の生存率を掛けたもの。
時点2の生存率は2/2であり、分母はNumber at Risk、そして分子はイベントの非発生例、です。
打ち切りは起こしていますが、イベントを起こして人はいないため、あくまで分子は2なのです。
次に時点3。
時点3の直前までは1人が残っているので、Number at Riskは1。(1名は時点1でイベントを起こしており、1名は時点2で打ち切りを起こしているため)
そして、時点3では1名がイベントを起こしているため、残りは0人。
だから2/3*0/1=0の累積生存率ですね。
この時、分母はNumber at Riskであり、分子はイベントの非発生例、ということになります。
このような計算をしてカプランマイヤー曲線が示されているのです。
状況2での解析結果
次に状況2での解析結果。
結論から示すと、結果としてはこんな感じになります。
時点1は状況1と同じなので、2/3でいいですよね。
じゃあ時点2はというと、直前までは2名いるため、Number at Riskは2でイベント発生が1名。
なので、2/3*1/2=1/3という累積生存率になります。
最後の時点3は打ち切り。
Number at Riskは相変わらず1ですが、時点3では打ち切りが発生して、イベントは発生していない。
なので、1/3*1/1=1/3という計算結果に。
そしてそれ以降の情報はありませんので、ここでカプランマイヤー曲線は終了、ということになります。
状況3での解析結果
最後に状況3での解析結果。
結論から示すと、結果としてはこんな感じになります。
時点1は打ち切りです。
なので、Number at Riskは相変わらず3ですが、時点1では打ち切りが発生して、イベントは発生していない。
だから、3/3=1というのが累積生存率です。
じゃあ時点2はというと、直前までは2名いるため、Number at Riskは2でイベント発生が1名。
だから、1*1/2=1/2という計算結果。
そして時点3は1名イベントを起こしています。
だから、1/2*0/1=0という累積生存率になるのです。
状況の違いでNumber at Riskや累積生存率はどう変化したか?
これまで3つの状況を見てきた通り、イベントが起こっても打ち切りが起こってもその後にリスク人数が減ることは同じでしたね。
そのため、3つの状況でNumber at Riskは全時点で同じ。
しかし、イベントなのか打ち切りなのかによって、累積生存率を計算する際の分子の数値が違います。
なので、その時点の生存率計算も異なるし、結果としてカプランマイヤー曲線も変わります。
まとめ
いかがでしたか?
この記事では「Number at Riskとは統計でどんな意味?累積生存率との関係」ということでお伝えしました。
- Number at Riskがどんな意味を持つのか?
- Number at Riskが累積生存率にどう影響を及ぼすのか
ということが理解できたのなら幸いです!
カプランマイヤー曲線、ログランク検定、Cox比例ハザードモデルは、生存時間解析の3種の神器と言ってもいいほど頻出しますので、ぜひ理解しましょう!
こちらの内容は動画でも解説していますので、併せてご確認くださいませ。
コメント