生存時間解析とセットで出てくるカプランマイヤー曲線。
ガタガタした形状が特徴の曲線ですね。
がん領域を担当したことがあれば、カプランマイヤー曲線は必ずや1度は目にしているでしょう。
でも、カプランマイヤー曲線の解釈の仕方や見方を正確に理解している人は少ないようです。
- カプランマイヤー曲線の中でどこがイベント?
- カプランマイヤー曲線の中でどこが打ち切り?
これらの知識もわかりやすく解説しますので、カプランマイヤー曲線の解釈方法を是非ともこのページでマスターしましょう!
カプランマイヤー曲線とは?どこが打ち切りでどこがイベント?
カプランマイヤー曲線は、生存時間解析のデータを可視化したもの、になります。
そう、イベントと打ち切り、ですね。
つまりカプランマイヤー曲線は、イベントと打ち切りがどの時点で発生したかを可視化したもの、と言い換えることができます。
カプランマイヤー曲線の見方を簡単に解説
イベントと打ち切りがどの時点で発生したかを可視化したものがカプランマイヤー曲線でした。
では、どこがイベントでどこが打ち切りか、ということが理解できればよいわけです。
まずは早速、カプランマイヤー曲線を見てみましょう。
これは、2群のカプランマイヤー曲線です。
まずは前提として、2群で差があるカプランマイヤー曲線はどういった曲線かわかりますか?
それは、二つの曲線が離れていればいるほど、2群に差があるデータであるということです。
そして、曲線の縦軸と横軸ですが、それぞれ以下のことを示しています。
縦軸:生存割合(イベントが発生していない割合)
横軸:時間
この例では、時間が0の時点でYが100%であるため、縦軸は「イベントが発生していない割合」になります。
もしイベント発生割合にしたい場合には、このようなカプランマイヤー曲線になります。
時間が0の時点でYが0の曲線ですね。
これらのカプランマイヤー曲線、2つの特徴があります。
- なめらかではなく、ガタガタしている
- 曲線の所々に「ヒゲ」みたいなものがついている。
上記の2つ、ぜひ気づいてください。
なぜならその2つが、イベントと打ち切りを示しているからです。
カプランマイヤー曲線の見方:段が下がったところがイベント
まずは、イベントがどこかを見てみましょう。
縦軸は「生存(イベント未発生)割合」です。
そして、死亡(イベント)が起こると当然、生存割合は低下します。
つまり、ガタガタしている曲線の下がった部分が、死亡した(イベントが起きた)という情報になります。
これを言い換えると、「イベントが発生した数しか段が下がらない」ということにもなります。
段が下がると、死亡(イベント)が発生していることを示しているため、下側にある曲線の方が、死亡(イベント)が多く発生していることになります。
反対に、死亡(イベント)が少ないと、上側に曲線が引かれることになります。
カプランマイヤー曲線の見方:ヒゲが打ち切り
そして2つ目の特徴の打ち切り。
これは、カプランマイヤー曲線のヒゲの部分です。
これがある時点で、打ち切りがあったことを示しています。
打ち切りとは、イベントではない「不完全なデータ」と言い換えることもできます。
そのため、打ち切りデータの数や出方で、その研究の信頼性をある程度読み取ることもできます。
これは、打ち切りデータが0であれば信頼性が高い、ということではありません。
試験脱落はないに越したことはありません。
ですが、臨床試験という「ヒト」を対象とした研究を行う以上、脱落は一定確率で起こり得ます。
そのため、脱落がない試験結果の場合には、脱落例を全て除いて解析しているのではないか、という疑問が出てきます。
また、試験終了時に生存していた方(イベントを発生していない方)のデータも打ち切りデータになります。
つまり、打ち切りデータのない試験結果は、ほとんどありえません。
まとめると、このようなことです。
カプランマイヤー曲線から読み取れるデータは中央値と生存割合
カプランマイヤー曲線は、イベントと打ち切りを知るためだけの曲線ではありません。
他にも読み取れるものが2つあります。
- 中央値
- X年(X日、X週など、X軸の単位に応じた)生存割合
例えば、このカプランマイヤー曲線で実線の群をA群、点線の群をB群とします。
すると、A群とB群のそれぞれの中央値は以下の図の通りになります。
つまり、イベント割合の中央値(0.5)とカプランマイヤー曲線がぶつかったところが中央値になる、ということです。
実際にこの図のデータを生存時間解析によって解析すると、A群の中央値は23、B群の中央値は8になります。
今度は逆に、X軸からカプランマイヤー曲線を見てみます。
例えば、20日目のそれぞれの生存割合を知りたいとき。
X軸の20日目に引いた直線と、各群のカプランマイヤー曲線が交差する点がそれぞれの20日生存割合になります。
カプランマイヤー曲線をEZRやJMPでも書き方を解説!
カプランマイヤー曲線をEZRで作成する方法を、別記事で解説しています。
EZRとは無料の統計ソフトであるRを、SPSSやJMPなどのようにマウス操作だけで解析を行うことができるソフトです。
EZRもRと同様に完全に無料であるため、統計解析を実施する誰もが実践できるソフトになっています。
2019年5月の時点で英文論文での引用回数が2400回を超えているとのことで、論文投稿するための解析ソフトとしても申し分ありません。
これを機に、EZRで統計解析を実施してみてはいかがでしょうか?
JMPでもカプランマイヤー曲線を描く方法を解説しています!
カプランマイヤー曲線に関するまとめ
- カプランマイヤー曲線は、生存時間解析のデータを可視化したもの。
- 曲線の段が下がった部分がイベント発生を示しており、ヒゲが打ち切り発生を示している。
- 中央値やX年(X日、X週など、X軸の単位に応じた)生存割合も、視覚的に確認することができる。
ちなみに、カプランマイヤー曲線とセットでよく見かけるのは「ログランク検定」のP値ですよね。
ぜひカプランマイヤー曲線とセットでログランク検定も理解していきましょう!!
コメント
コメント一覧 (6件)
[…] […]
[…] 生存時間解析結果を可視化する方法が、カプランマイヤー曲線ですね。 […]
[…] 研究では、左上からのカプランマイヤー曲線のグラフだけでなく左下からの累積発生率のグラフが必要になることもあります。 […]
[…] 特に、カプランマイヤー曲線の下についている数字です。 […]
[…] また、観察期間を考慮するということは、転院などによりイベント発生前に打ち切りとなった被験者も含めて計算されることになるのでバイアスも起こりにくくなります。 […]
[…] それは「打ち切り」の定義。 […]