わかりやすい生存時間解析 – いちばんやさしい、医療統計

初心者必見！左側打ち切りとAndersen-Gillモデルを正しく使うためのコツ

beat1115 — Wed, 20 Aug 2025 01:20:53 +0000

「Coxモデルでは解析できないって、どういうこと……？」

生存時間解析の定番といえばCox比例ハザードモデルですが、現実のデータはそんなに単純ではありません。

例えば、再発が何度も起きる疾患や、研究に参加する前からリスクが始まっていた人（＝左側打ち切り）など、1回だけのイベントに収まらないケースは少なくありません。

そんなときに力を発揮するのが、Andersen-Gill（AG）モデルです。

本記事では、「左側打ち切りとは何か？」「Coxモデルではなぜ対応できないのか？」「Andersen-Gillモデルの考え方と実装方法」までを、統計初学者でも理解できるように、やさしく・ていねいに解説していきます。

Rでのサンプルコード付きなので、再発データの解析を始めたい人にも実践的な一歩となる内容です。

左側打ち切りデータとは何か？

生存時間解析というと、一般には「ある出来事がいつ起きるか」を予測・説明する統計手法のことを指します。

たとえば「がん患者が再発するまでの期間」「機械が故障するまでの稼働時間」など、イベントのタイミングに注目します。

ですが実際のデータ収集では、全ての事象を最初から最後まで観察できるとは限りません。そんな現実に対応するために生まれた概念が、「打ち切り（censoring）」です。

打ち切りデータとは？3つの分類を押さえよう

まず前提として、「打ち切り」とは“いつイベントが起きたのか正確にわからない”という情報のことです。生存時間解析では、この打ち切りのタイプをしっかり理解しておくことがとても重要です。

主に以下の3種類があります。

右側打ち切り（Right-censoring）
最もよく使われる打ち切りです。ある対象者について、観察期間中にイベントがまだ起きていないため、「いつ起きるか」はわからない。
例：調査終了時点でまだ再発していない患者。
左側打ち切り（Left-censoring or truncation）
観察を開始した時点で、すでにイベントが起きていた可能性があるが、いつ起きたかは不明。
例：健康診断で糖尿病と診断されたが、いつから糖尿病だったか不明。
区間打ち切り（Interval-censoring）
イベントがある期間内に起きたことはわかるが、正確な時点がわからない。
例：年1回の健康診断で、前回は異常なし、今回は陽性＝その間に発症した。

左側打ち切りが起きやすい状況とは？

左側打ち切りは、過去の履歴を持つ被験者や対象者を途中から観察する場面でよく発生します。以下のようなケースを想像すると、理解しやすいかと思います。

臨床研究の例
ある研究が「心疾患の初発までの期間」を調べるものだとします。ところが、すでに症状を経験している患者も、研究参加時には「治療中」や「経過観察中」だった場合、いつ心疾患が起きたかが記録されていないことがあります。

このように「いつ発症したか」がわからないデータが含まれると、初発までの正確な時間が不明になります。

なぜ左側打ち切りが分析を難しくするのか？

左側打ち切りがあると、「本来の観察開始時点が欠けている」ことになります。

つまり、生存時間（eventまでの時間）を過小評価してしまう可能性があるのです。

たとえば、ある患者が研究参加前に糖尿病を発症していたとします。

でも私たちは「参加時点で糖尿病である」ことしか知らないので、「糖尿病になったのは、研究に参加してから」と誤解してしまうリスクがあります。

これは生存時間解析の根幹――「イベントの発生時刻と、それに至る時間をどう扱うか」――において、非常に深刻なズレを生む原因になります。

左側打ち切りデータは、Coxモデルでは対応できない？

Cox比例ハザードモデルは、右側打ち切りには標準的に対応できますが、左側打ち切りには対応できません。なぜなら、モデルが前提としているのは、「全ての対象が同じ基準時点（スタート）から追跡される」という条件だからです。

この前提が崩れると、ハザード比の推定やサンプルの扱いにバイアスが生じ、誤った因果関係や効果の大きさが導かれてしまう恐れがあります。

左側打ち切りを完全に避けるのは難しい

現実のデータ分析では、完璧な情報を持った「理想的な被験者」ばかりを揃えることはできません。特にレトロスペクティブ研究（過去の記録に基づく研究）や、電子カルテのような“途中から収集されたデータ”では、左側打ち切りは避けがたい問題です。

ここで登場するのが、再発や時間依存共変量を扱える「Andersen-Gillモデル」です。このモデルを使えば、観察開始時点を“0”とし、そこからの再発イベントを扱うという構造がとれるため、左側打ち切りの影響を最小限に抑えることが可能です。

言い換えれば、「本当のスタート時点が不明でも、観察開始からのデータを活かしてモデル化する」柔軟な方法を与えてくれるのです。

左側打ち切りデータは、「すでにイベントが起きていたかもしれないけど、それがいつだったのか不明」という、実務上とてもよくあるデータ状況です。そしてこれに対応するには、単純なCoxモデルでは不十分。再発や時間依存性を考慮した解析手法の出番です。

Cox比例ハザードモデルでは足りない場面

生存時間解析の代表的な手法といえば、やはり「Cox比例ハザードモデル」が有名です。多くの教科書でも最初に登場し、RやPythonなどの統計ソフトにも標準で実装されています。

では、なぜこのCoxモデルだけでは不十分な場面があるのでしょうか？

この章では、Coxモデルの基本を復習したうえで、現実のデータにおける「限界」と、それを補う必要性について丁寧に解説します。

Coxモデルとは？ざっくり復習

Cox比例ハザードモデル（Cox Proportional Hazards Model）は、生存時間と共変量の関係を調べるためのモデルです。

このモデルのポイントは、「特定の変数がハザード（イベントが起きる確率）にどの程度影響するか」を、ハザード比（Hazard Ratio, HR）という形で示せることです。

ここでの「比例」とは、「リスクの形は変えずに高さだけを変える」＝共変量が時間によらず一定の影響を持つ、という意味です。

現実には「1回で終わらないイベント」も多い

さて、ここで想像してみてください。たとえば次のようなデータです。

がんの再発を追う医療研究
うつ病の再発調査
工場での機械トラブル（何度も壊れる）
企業の従業員が何度も休職するケース

これらはいずれも「1人（あるいは1台、1事象）につき、複数回イベントが起きる」タイプのデータです。

ところが、Coxモデルではこのような「複数回のイベント（recurrent events）」には原則として対応できません。

なぜなら、Coxモデルの基本的な単位は「1人あたり1回のイベントを記録する」というものだからです。

たとえば、1人の患者が3回再発した場合、Coxモデルでは最初の再発しか扱えず、それ以降の再発データは無視されてしまいます。これでは、せっかくの貴重なデータを捨ててしまうことになりますよね。

「時間とともに変わる変数」にも対応しにくい

もうひとつ、Coxモデルの限界として挙げられるのが、「時間依存性共変量（time-dependent covariates）」の取り扱いです。

現実のデータでは、治療内容や生活習慣、環境条件などが時間とともに変化することは珍しくありません。たとえば：

「途中から薬を飲み始めた」
「退院して在宅療養に切り替わった」
「会社の制度が変わった」

このような変化があると、共変量が時間の経過とともに変わってしまい、単純なCoxモデルでは“1つの値”として入力できません。

これを無視すると、推定に大きな誤差が生じたり、リスクの因果関係を見誤る恐れがあります。

左側打ち切りとCoxモデルの相性

さらに、前のセクションでも解説した「左側打ち切り」もCoxモデルにとっては厄介です。

Coxモデルは、「全員が同じ時点から観察されている（＝スタートが揃っている）」という前提で設計されています。そのため、観察開始前にすでにイベントが起きていたかもしれない人（＝左側打ち切り）を含めると、生存時間の計算がおかしくなってしまうのです。

結果として、解析対象から外さざるを得ず、サンプルサイズが減ったり、バイアスが生じたりすることもあります。

このように、Coxモデルは生存時間解析の基本中の基本ではありますが、現実のデータ構造――特に次のような状況――には対応が難しいです。

1人が複数回イベントを経験する（再発）
時間とともに変わる共変量を扱いたい（処置・環境）
左側打ち切りが存在する（初発タイミングが不明）

これらの課題に柔軟に対応できるモデルとして登場したのが、Andersen-Gillモデルです。

このモデルはCoxモデルの枠組みを活かしつつ、時間依存性や再発を「カウントプロセス」としてモデル化することで、より複雑な現実のデータに対応することができます。

Andersen-Gillモデルって何？ざっくり解説

前のセクションで、Cox比例ハザードモデルには「1回限りのイベントしか扱えない」「時間とともに変化する変数に弱い」といった限界があることを解説しました。

現実のデータには、1人の患者が何度も再発したり、環境や治療状況が変化したりするケースが数多くあります。

そうした複雑な状況に対応するために開発されたのが、Andersen-Gill（AG）モデルです。

このセクションでは、AGモデルが何を解決してくれるのか、Coxモデルとどう違うのか、初心者でも理解しやすいようにやさしく紹介します。

Andersen-Gillモデルとは？

Andersen-Gill（AG）モデルは、再発や複数イベントを解析するための拡張Coxモデルです。

1970年代末にAndersenとGillによって提案され、Coxモデルの考え方をベースにしつつ、「1人の対象に複数のイベントが起きる」ことを前提に設計されています。

最大の特徴は、「Counting Process（カウントプロセス）」という考え方を取り入れている点です。

これは、1人の対象を“時間帯ごとのイベントのまとまり”として捉えるアプローチであり、時間依存性共変量や複数イベントにも対応可能です。

Andersen-Gill（AG）モデルはどんな場面で使えるの？

AGモデルは、以下のような繰り返しイベントのある研究にとても適しています。

医療：がんや心疾患の再発、再入院、感染症の再感染
メンタルヘルス：うつ病エピソードの再燃
行動研究：犯罪者の再犯や交通違反の再発生
ビジネス：ユーザーのサービス再利用、顧客の離脱と復帰
工業・IT：機械の再故障、システム障害の再発

どれも1回で終わるわけではなく、複数回発生しうるイベントですよね。AGモデルは、まさにこういった「繰り返し」の構造をモデルとして自然に取り入れることができるのです。

Andersen-Gill（AG）モデルはデータの構造がカギ：「start-stop」形式

AGモデルでは、Coxモデルと異なり、1人のデータを複数行に分割して記録する必要があります。

たとえば、1人の患者が3回再発した場合、次のような構造になります。

id	start	stop	event	treatment
1	0	50	1	0
1	50	100	0	1
1	100	150	1	1

このように、「start」から「stop」までの期間を1単位として、各期間でイベントが発生したか（event = 1）を記録します。

治療内容（treatment）などの共変量も、期間ごとに変更できます。これにより、「時間依存性共変量」も自然に組み込むことができます。

AGモデルの根本的な考え方は、Coxモデルの数式に基づきつつ、「再発イベントも含めて、全部“1つのデータ”としてまとめて解析する」というアプローチです。

1人の対象に複数のイベントがあると、それらは独立ではありません。最初の再発が次の再発に影響を及ぼすことはよくあります。

AGモデルでは、この依存性に対応するために、「クラスタリング（cluster）」というテクニックを用います。

Rで実装する際には、cluster(id)のように指定することで、個人ごとのイベントの相関を考慮し、標準誤差の過小評価を防ぐことができます。

Andersen-Gill（AG）モデルは左側打ち切りにも強い

AGモデルは、「観察開始時点からの再発イベントを扱う」という構造を取るため、左側打ち切りにもある程度対応できます。

たとえば、すでに糖尿病を発症している患者が研究に参加した場合、その人の「初発」はわかりませんが、「参加後の再発」は記録できます。

AGモデルは、そういった“再発だけ”を扱う設計なので、左側打ち切りの人も解析対象として含めやすいのです。

Andersen-Gillモデルの使いどころと注意点

ここまでで、Andersen-Gill（AG）モデルが「再発や時間依存性共変量に強い」という特徴を持つことがわかってきました。

しかし、「このモデルは便利そうだから、とりあえず使えばOK！」というわけではありません。

すべてのケースで万能ではないからこそ、「どんなときにAGモデルを使うべきか？」「どんな点に注意すべきか？」をしっかり押さえておくことが大切です。

このセクションでは、他のモデルとの比較を交えながら、AGモデルの適用場面と注意点について丁寧に解説していきます。

まずは整理：似ているけど違うモデルたち

繰り返しイベントのあるデータを扱う手法はいくつかあります。Andersen-Gillモデルはその一つにすぎません。以下のような他の方法ともよく比較されます。

モデル名	対応できる特徴	主な想定
Cox比例ハザードモデル	イベント1回／時間依存性×	最初の発症まで
時間依存性Coxモデル	イベント1回／時間依存性◯	処置や環境が変わる場合
Andersen-Gillモデル	イベント複数／時間依存性◯	再発・複数事象があるとき
負の二項回帰モデル	回数に対応／時間無視	期間内のイベント回数だけを知りたい場合

AGモデルは、「繰り返しイベント × 時間情報を重視 × 処置の影響も調べたい」といった分析に最適です。

逆に言えば、「イベントは1回しか起こらない」または「イベントの回数だけ知りたい」場合には、他のモデルの方が適していることもあります。

Andersen-Gillモデルを使う際の注意点

便利なAGモデルですが、注意すべき点もいくつか存在します。とくに次のようなポイントは、初心者でも押さえておくべき重要な項目です。

イベント間の独立性を仮定している（が、実際は依存している）

AGモデルは、1人の対象におけるイベント（例：再発1回目、2回目、3回目）を、統計的に独立しているものとして扱います。しかし実際には、1回目の再発が2回目のリスクに影響を与えることはよくありますよね？

この「イベント間の依存性」がモデルに無視されるため、標準誤差が過小評価されやすいという問題があります。これを補うためには、cluster(id)で個体ごとの相関を考慮する必要があります。

全体の“ハザード構造”は共有される

AGモデルでは、すべての再発が同じ“ハザード構造”に従うと仮定されます。つまり、「1回目の再発」と「3回目の再発」では、基本的なモデル構造は変わらないとみなされます。

しかし、現実には再発を繰り返すほど病状が重くなったり、対応が変わったりすることもあります。そういった「イベントごとの変化」をモデルに入れたいときには、PWPモデルやfrailtyモデルといった別のアプローチが必要です。

観察期間の分割が必須で、データ加工が大変

AGモデルでは、「start–stop形式」で時間を分割したデータを準備する必要があります。これには手間がかかる上、観察期間の分け方に迷うこともあります。特に時間依存性共変量が複雑になると、手動でのデータ構築が面倒になる可能性があります。

この点は、事前に計画を立ててスクリプト化しておくと作業効率が上がります。

解釈には丁寧さが求められる

AGモデルの出力結果は、Coxモデルと同様に「ハザード比（HR）」として出てきます。ただし、1人あたり複数のイベントを対象としているため、そのHRが示す意味合いも少し複雑になります。

たとえば、「治療Aがハザードを30%下げる」という結果が出た場合、それは再発全体に対する効果であり、1回目か2回目かを区別した効果ではありません。

RでAndersen-Gillモデルを実装する

ここまでで、Andersen-Gillモデルの理論や使いどころについて詳しく学んできました。では、実際にRでこのモデルをどのように実装すればよいのか？ 初心者にもわかりやすく、具体的なコード例とあわせて解説していきます。

ポイントは、「start–stop形式でのデータ構造」と「cluster()による個体内相関の考慮」です。

Andersen-Gillモデルは、Rの標準的な生存時間解析パッケージである**survival**に組み込まれています。まずは必要なライブラリを読み込みましょう。

install.packages("survival")  # 初回のみ
library(survival)

次に、AGモデルを使うには、データを「start–stop形式」に整える必要があります。これは、時間区間ごとに行を分けて記録する形式です。

例として、以下のような再発データを想定しましょう。50例分のサンプルデータを作成しています。

データはこちらからダウンロードできます。

このように、1人の対象者が複数行で表されている点が重要です。それぞれの行が、ある期間中の情報（start〜stop）を記録しています。

生存時間のオブジェクトには Surv() を使います。AGモデルでは「start, stop, event」の形式を取り、coxph() で回帰を実行します。

cox_model <- coxph(
  Surv(start, stop, status) ~ treatment + cluster(id),
  data = example_data #example_dataという名前でRにインポートしている場合
)

summary(cox_model)

ポイント：

Surv(start, stop, status)：期間型のSurvオブジェクト（イベントの発生を時系列で表現）
cluster(id)：同じ対象者（id）内の相関を考慮し、標準誤差の過小評価を防ぐ
treatment：共変量（時間依存性を含めることも可能）

summary(cox_model) を実行すると、以下のような出力が得られます：

この結果は、「treatmentを受けた期間は、受けていない期間に比べて再発のハザードが2.2%上昇する」という意味になります（HR = 1.022）。exp(coef) がハザード比です。

ここで注意してほしいのは、これは「再発全体に対する平均的な影響」であり、「1回目だけ」とか「2回目に特化した効果」ではない点です。

時間依存性共変量も使える

たとえば、treatment が「途中から開始される」ような状況では、行ごとに値を変えれば、時間依存性共変量として自動的に反映されます。

これはCoxモデルでも Surv(start, stop, status) 形式を使えば可能ですが、イベントが1回しか扱えないという制限があるため、AGモデルの方がより柔軟です。

Q&A：よくある質問に答えます

ここまでで、Andersen-Gillモデルの理論、使いどころ、実装方法まで学んできました。

しかし、初学者が実際に解析を始めようとすると、ふとした疑問や混乱にぶつかることも少なくありません。

このセクションでは、講義や実務の現場でよく出る質問をピックアップし、丁寧に回答していきます。初心者がつまずきやすいポイントを一つずつ整理して、理解を深めていきましょう。

Q1. Andersen-Gillモデルでも「ハザード比（HR）」で結果が出てくるの？

✅ はい、出てきます。

Andersen-Gillモデルは、Coxモデルの拡張形です。そのため、回帰係数の解釈はCoxモデルと同じく「ハザード比（HR）」として表現されます。

ただし、対象が「1回きりのイベント」ではなく「複数の再発を含む全イベント」になっている点が異なります。つまり、得られるハザード比は「全体として再発しやすいかどうか」を評価しており、特定の再発順（1回目／2回目など）に限定された効果ではありません。

例：treatmentのHRが0.65 → 治療中は再発のリスクが全体的に35%下がると解釈します。

Q2. Cox回帰も Surv(start, stop, event) で時間依存共変量を扱えるけど、AGモデルとどう違うの？

✅ 最大の違いは、「複数回のイベントを扱えるかどうか」です。

Coxモデルでも Surv(start, stop, status) 形式を使えば、時間依存共変量（たとえば、治療を途中で変更するなど）を扱うことができます。

ただし、Coxモデルは基本的に「1人につき1回のイベント」までしか扱いません。複数のイベントがある人については最初のイベント以外を無視してしまうのが原則です。

一方、AGモデルは「1人につき何回でもイベントを記録して良い」構造になっており、再発や反復事象を解析する際には必須のモデルです。

Q3. 「左側打ち切り」って、結局どう扱えばいいの？

✅ “初発はわからないけど、再発からは観察できる”場合に強いのがAGモデルです。

左側打ち切りとは、「研究参加時点ですでにイベントが起きていたかもしれないが、その時点がわからない」状態です。

Coxモデルでは、スタート時点が揃っていない人を除外する必要がありますが、AGモデルでは再発イベントから解析を始める構造にできるため、「初発が不明でも再発があれば使える」＝実質的に左側打ち切りにも対応可能というメリットがあります。

例：初めてのうつ病発症が不明でも、再発時点から記録すればAGモデルに含められる。

Q4. 再発イベントの回数だけに注目したいなら、AGモデルじゃなくてもよい？

✅ はい、その場合は「負の二項回帰モデル」などのカウントデータモデルの方がシンプルです。

AGモデルは「時間と再発の関係」や「治療の効果」を時間軸上で評価するモデルです。もし、再発のタイミングではなく“回数だけ”を分析したいのであれば、Poisson回帰や負の二項回帰モデルの方が向いています。

ただし、これらのモデルでは時間依存性やイベントの順序は無視されるため、「時間の経過が重要」「再発の間隔を評価したい」場合はAGモデルが優れています。

Q5. Andersen-Gillモデルで、イベント間の依存関係はどう処理されている？

✅ 厳密には“していない”。cluster()で補正をかける必要があります。

AGモデルは、「1人の中の複数のイベントは統計的に独立である」という仮定を置いています。実際には、再発1回目の影響が2回目に波及するような依存関係がありますよね。

この“依存性”を補正するために、cluster(id) を指定することで、標準誤差にロバストな修正をかけることができます。これは必須ではありませんが、実務ではほぼ必須と思ってください。

Q6. Andersen-Gillモデルって難しそう。初心者でも使うべき？

✅ 「タイミング」「再発」「処置の変更」に興味があるなら、挑戦すべきです。

たしかにAGモデルは、Coxモデルよりも準備や理解が難しい部分があります。特に「データをstart–stop形式に整える作業」は最初はハードルに感じるかもしれません。

ですが、そのハードルを乗り越えることで、

現実の複雑なデータに対応できる
有効な再発予測ができる
時間依存性をモデルに反映できる

という強力なスキルセットが手に入ります。

実際、多くの医療研究や社会データ分析ではAGモデルが使われており、「実践的な統計解析スキル」として身につけておく価値は非常に大きいです。

まとめ：繰り返す現象と時間の流れを、見落とさずに捉えるために

生存時間解析と聞くと、まず思い浮かぶのはCox比例ハザードモデル。しかし、現実のデータはもっと複雑です。人は何度も病気を再発し、機械は何度も壊れ、状況は時間とともに変わっていきます。

そんな「1回きりでは終わらない現象」と「変化し続ける世界」を丁寧に捉えるためには、Andersen-Gillモデルという視点がとても有効です。

このモデルの強みは以下の通りです：

複数のイベント（再発）を1人あたり複数回扱える
時間依存性共変量（途中で処置が変わるなど）に対応できる
左側打ち切りの人もデータに含めやすい
Rでの実装が可能で、Coxモデルの延長線上で使える

一方で、すべての問題を自動で解決してくれる「魔法のモデル」ではありません。イベント間の依存性、モデルの前提、データ整形の負荷など、注意すべき点も確かに存在します。

ですが、そうした点を理解したうえでAGモデルを選び、適切に使いこなせるようになると、あなたの統計解析の幅は格段に広がるでしょう。

時間と再発が交差するデータを前にしたとき、この記事の内容を思い出して、柔軟な分析と解釈に役立てていただければ幸いです。

こちらの内容はYoutubeでも解説しております。

ぜひこちらの動画をご覧くださいませ。

C統計量（C-index）とは？意味・計算方法・AUCとの違いをわかりやすく解説

beat1115 — Sat, 09 Aug 2025 03:28:43 +0000

「C統計量ってAUCと何が違うの？」

統計や機械学習に触れた人なら、一度は疑問に思ったことがあるかもしれません。

特に医療や金融の分野では、AUCと並んでC統計量（またはC-index）がよく登場しますが、初めて耳にした人には馴染みが薄い指標です。

実はC統計量とC-indexはほぼ同じ指標であり、呼び方が分野によって異なるだけです。

この記事では、そんな混乱しがちなC統計量について、以下の流れでわかりやすく解説します。

C統計量（C-index）の基本的な意味と役割
ROC曲線やAUCとの違いと関係性
計算方法とプログラミングでの実装例
C統計量を利用する際に注意すべきポイント

特に、C統計量は「予測の順序の正確さ」を測る指標であることが特徴です。

これは単なる的中率とは異なり、モデルが高い確率で正しい順序付けを行えているかを評価するもので、2値分類から生存時間解析まで幅広く使えます。

C統計量（C-index）とは？基本の定義

C統計量（C-statistics）とは、予測モデルが「対象を正しく順位づけできる能力」を数値化した指標です。

例えば、がん患者の生存期間を予測するモデルがあったとします。

このとき、患者Aの予測生存期間が患者Bより長いとモデルが判断し、実際にAのほうが長生きだった場合、それは「順序が正しい（concordant）」といえます。

このような予測と実際の結果が一致する割合を集計したものがC統計量です。

C統計量とC-indexの関係

結論から言うと、C統計量とC-indexは同じ指標です。

どちらも「Concordance index（適合指数）」の概念を指しており、計算方法や解釈は変わりません。

ただし、使われる場面や分野によって呼び方が異なる傾向があります。

C統計量とC-indexという用語が使われる場面

C統計量（C-statistics）
主に医療統計や臨床研究の論文で用いられる。ROC曲線のAUCとほぼ同義として説明されることも多い。
C-index（Concordance index）
生存時間解析（Cox比例ハザードモデルなど）や機械学習分野でよく使われる呼び名。観測中に打ち切られたデータにも対応可能。

このように、呼び方は異なりますが「予測の順序をどれだけ正しく当てられるか」を表すという本質は変わりません

したがって、論文やコードを読む際には、「C統計量＝C-index」と考えて差し支えありません。

C統計量は0〜1の範囲を取る

C統計量は0から1の範囲で表されます。

1.0 → 完全一致（すべてのペアで予測順序が正しい）
0.5 → ランダム予測と同等（識別能力がない）
0.0 → 完全に逆順（予測がすべて外れている）

実務では、0.7以上であれば「まずまず信頼できる」、0.8を超えると「かなり良いモデル」とされることが多いです。

ただし、これはあくまで目安であり、分野や課題によって基準は変わります。

C統計量とROC曲線・AUCとの違い

ROC曲線（Receiver Operating Characteristic curve）は、分類モデルの性能を視覚的に評価するためのグラフです。

横軸に偽陽性率（False Positive Rate）、縦軸に真陽性率（True Positive Rate）を取り、さまざまな閾値（しきい値）でモデルを動かしたときの点をつなぎます。

このROC曲線の下の面積を計算したものがAUC（Area Under the Curve）です。

AUCは0〜1の範囲で表され、1に近いほどモデルの識別能力が高いことを意味します。

0.5であれば、モデルがランダム予測と同等であることを示します。

C統計量とAUCの関係

C統計量は、実は二値分類モデルにおいてはAUCと全く同じ値になります。

なぜなら、AUCは「ランダムに選んだ陽性サンプルと陰性サンプルのペアで、モデルが陽性のほうを高く予測できる確率」を表し、これはC統計量の定義と一致するからです。

しかし、C統計量は生存時間解析や順位データにも適用できるという点でAUCより汎用性があります。

特に、生存時間データでは観測が途中で打ち切られる「打ち切り（censoring）」がよく発生しますが、C統計量はこの打ち切りを考慮して計算できます。一方、AUCは通常、二値分類問題に限定されます。

まとめると：

二値分類問題 → C統計量＝ AUC
生存時間解析 → C統計量がAUCの一般化版

C統計量はAUCを包括する概念であり、二値分類では同じになります。

しかし生存時間解析や打ち切りデータを扱う場合にはC統計量が必要になるということです。

C統計量の計算方法

C統計量は、「予測が実際の結果の順序と一致している確率」を求めるだけです。

具体的には、全ての対象ペア（2人組）を比較し、モデルが予測した順序と実際の結果を比べます。

例えば、生存時間解析で患者Aと患者Bを比較したとき：

Aの予測リスクがBより低く、かつAが実際に長く生存 → 順序一致（Concordant）
Aの予測リスクがBより高いのに、Aが長く生存 → 順序不一致（Discordant）
生存時間が同じ、または予測スコアが同じ → タイ（Tie）

C統計量は、一致ペアの数＋0.5×タイの数 を全ペア数で割ることで求められます。

C統計量の実際の計算式

C統計量の計算式はこのようになります。

ここで：

Concordant pairs = 順序が正しいペアの数
Ties = 同点のペアの数
All comparable pairs = 比較可能な全ペアの数（打ち切りがある場合は除外）

生存時間解析の場合、打ち切りデータに対しては「比較可能かどうか」を判定し、比較できないペアは計算から除きます。

これが、C統計量がAUCよりも柔軟に使える理由です。

RでC統計量を計算する例

実際にRでもC統計量は簡単に作成できます。

ここでは、Survivalパッケージに含まれる「lung」というデータでC統計量を計算してみます。

# survivalパッケージを読み込み
library(survival)

# lungデータを確認
head(lung)

# Cox比例ハザードモデルを作成
# time = 生存時間（日）
# status = 1: 生存, 2: 死亡 → Surv()内では死亡を1とする必要があるため status-1
cox_model <- coxph(Surv(time, status == 2) ~ age + sex + ph.ecog, data = lung)

# モデルの概要を表示
summary(cox_model)

# C統計量の計算
c_stat <- concordance(cox_model)
c_stat

上記のプログラムを実行すると、C統計量は0.6371と計算することができました。（Concordance=0.6371の部分です。）

C統計量を使うときの注意点

C統計量はペア比較に基づくため、サンプル数が少ないと評価が不安定になりやすいです。

特に、生存時間解析で打ち切りデータが多い場合、比較可能なペア数が極端に減り、C統計量が信頼できない数値になることがあります。

こうした場合は、ブートストラップ法などを使って信頼区間（Confidence Interval）を算出し、不確実性を明示するのが望ましいです。

論文やレポートでも、C統計量単独ではなく「C=0.72（95% CI: 0.68–0.76）」のように提示されるのが一般的です。

また、C統計量は順位の正しさを評価しますが、モデルの絶対的な予測精度やキャリブレーション（予測確率の適切さ）は測れません。

例えば、C統計量が高くても、予測確率そのものが全体的に過大評価されている可能性があります。こうした場合、キャリブレーションプロットなど、別の評価指標も併用すべきです。

まとめ

この記事では、C統計量（C-statistics）とC-indexについて、その意味、計算方法、AUCとの違いまでを解説しました。

ここで改めて、重要なポイントを整理しましょう。

C統計量とは？
- モデルが予測した順位と実際の結果がどれだけ一致しているかを測る指標。
- 値は0〜1の範囲で、0.5はランダム予測と同等、1に近いほど性能が高い。
C統計量とC-indexの関係
- 中身は同じ指標で、分野によって呼び方が異なるだけ。
- 医療統計では「C統計量」、機械学習や生存時間解析では「C-index」と呼ばれる傾向。
AUCとの違い
- 二値分類ではC統計量＝AUC。
- 生存時間解析や打ち切りデータではC統計量がAUCを一般化した形として機能する。
計算方法
- 全ての比較可能なペアに対して順序が正しいかを判定し、その割合を求める。
- Rで簡単に計算可能
注意点
- データの偏りで過大評価の恐れ。
- サンプル数不足で結果が不安定に。
- 他の指標と併用することが必須。

C統計量は、「モデルが予測の順序をどれだけ正しく当てられるか」を測るシンプルかつ強力な指標です。

特に、生存時間解析やリスク評価のように、単なる的中率では捉えきれない場面で真価を発揮します。

一方で、万能な指標ではありません。

データの質や構造を無視して数値だけを追いかけると、誤った結論にたどり着く危険もあります。

ですから、C統計量を使うときは、必ず他の評価指標や専門知識と組み合わせて判断することを忘れないでください。

こちらの内容はYoutubeでも解説しております。

ぜひこちらの動画をご覧くださいませ。

競合リスクとGray検定とは？打ち切りとして扱うことの問題点

beat1115 — Mon, 24 Mar 2025 06:00:48 +0000

この記事では「競合リスクとGray検定とは？打ち切りとして扱うことの問題点」ということでお伝えしていきます。

生存時間解析を学ぶと「競合リスク」という用語にぶつかることがあります。

競合リスクってそもそも何？
競合リスクがある場合の解決策3つ
競合リスクを考慮した解析であるGray検定をEZRで実践してみる

ということを理解できるようになりますよ！

競合リスクとは？

まずは競合リスクについて理解しておきましょう。

競合リスクの定義とは以下の通り。

競合リスクとは

複数のイベントが定義できる時、一方のイベントが起こると他方のイベントが観測できないこと

…わかるようでわからないような、、という感じかもしれないですね。

例を挙げて競合リスクを見てみましょう。

競合リスクの例

競合リスクの例としてよく用いられるのは「がんの増悪」と「増悪前の死亡」です。

ある研究において「がんの増悪」をイベントとして研究を実施したとします。

研究に組み入れられた被験者さんの中には、「がんが増悪する前に死亡」する方も出てくる可能性はありますよね。

もし「がんが増悪する前に死亡」してしまった場合、本当に見たい「がんの増悪」というイベントは未来永劫、観察できないことになります。

逆もまた然りで、「がんの増悪」というイベントが起こった場合に、「がんが増悪する前に死亡」というイベントは起こらないはず。

上記の場合、一方のイベントが起こると他方のイベントが観測できない、という関係が成り立つので、「がんの増悪」と「がんが増悪する前に死亡」というイベントは、互いに競合しているイベントである、と言えます。

このような場合に、競合リスクと呼んでいるのです。

競合リスクがあったときにどうすればいい？

では、競合リスクがあった場合にどうすればいいのでしょうか？

解決策としては3つ考えることができます。

興味あるイベント以外は打ち切りにする
興味あるイベントの定義を再考する
競合リスクを考慮した解析をする

それぞれ詳しくみていきましょう。

競合リスクがある場合の解決策1：興味あるイベント以外は打ち切りにする

これはもっともシンプルな方法ですね。

興味あるイベントが「がんの増悪」である場合、それ以外は全て打ち切りにする、という解決策です。

いわゆる、通常の生存時間解析として考える、ということ。

ただしこの解決策には一つだけ問題点があります。

それは「打ち切り」の定義。

通常の打ち切りが意味するところは「追跡できたところまではイベントが起きていない」ということであり、これは暗に「今後イベントが起こりうる可能性はある」ということを含んでいます。

例えば、試験期間が終了する時点で「がんの増悪」がみられなかった場合、試験終了まではがんの増悪はみられなかったけど、その後も追跡できるのであればイベントが観察できる可能性はあります。

しかし、増悪前の死亡を打ち切りにした場合、今後「がんの増悪」というイベントは絶対に起こらないですよね。

この矛盾が問題点となります。

競合リスクがある場合の解決策2：興味あるイベントを再考する

競合リスクがある場合の解決策2つ目は、興味あるイベントを再考することです。

例えば、「がんの増悪もしくは死亡のどちらか早い方」をイベントとする場合、上記の競合リスクの問題は解消されます。

そのため、通常の生存時間解析を適用することで問題はなくなります。

ただし、イベントを変えるということは試験の目的も変わる、ということですので、慎重に考える必要があります。

競合リスクがある場合の解決策3：競合リスクを考慮した解析を実施する

競合リスクがある場合の解決策3つ目は、競合リスクを考慮した解析を実施すること。

つまり、「増悪前に死亡」した方は「がんの増悪」が起こらないとして扱いながら、解析をするということです。

この解析方法がGray検定として知られています。

Fine & Gray検定は競合リスクを考慮して、注目したいイベントの群間比較ができる解析。

例えば、

注目したいイベント：がんの増悪
競合リスク：死亡

だったときに、死亡を考慮して、がんの増悪の群間比較ができる解析なんです。

このGray検定を実際にやってみる方法を次に紹介しますね。

競合リスクを考慮した解析：Gray検定をEZRで実践してみる

では、競合リスクを考慮した解析であるGray検定をEZRで実践してみましょう。

データは「EZRでやさしく学ぶ統計学」に付いているデモデータを用います。

状況としては、あるがん腫において

なんのイベントも起きていない：0
腫瘍の増悪：1
増悪せずに死亡：2

というデータになっていて、解析の目的は「増悪せずに死亡という競合リスクを考慮しながら腫瘍の増悪に対して群間比較をしたい」ということです。

Gray検定を実施する際に重要なのは、データの作り方。

以下のように、「打ち切り：0」「目的とするイベント：1」「競合するイベント：2」としてデータを作る必要があります。

他のデータ作成は、EZRで生存時間解析を実施する場合と同じで問題ありません。

EZRでGray検定を実施する

データができたところで、実際にGray検定を実施してみましょう。

「統計解析」＞「生存期間の解析」＞「累積発生率（競合イベントを含む）の記述と群間の比較（Gray検定）」を選択。

下記のような画面になるので、

観察期間の変数（1つ選択）には、生存期間の列を選択
イベント（1,2,3…）、打ち切り（0）の変数（1つ選択）には、上記の注意点のように「打ち切り：0」「目的とするイベント：1」「競合するイベント：2」とした列を選択
群別する変数を選択（0〜複数選択可）には、群別したい列を選択

すればOKです。

これでOKを押すと、下記のように結果が出力されます。

P値が2つ出ていますが、上はイベントが1（今回の場合、がんの増悪）に対する群間比較結果であり、下はイベントが2（今回の場合、増悪せずに死亡）の群間比較結果を示しています。

どちらの結果に注目すればいいのか？というと、今回の解析の目的は「増悪せずに死亡という競合リスクを考慮しながら腫瘍の増悪に対して群間比較をしたい」ですので、イベントが1（今回の場合、がんの増悪）に対する群間比較結果を参照する必要があります。

まとめ

いかがでしたか？

この記事では「競合リスクとGray検定とは？打ち切りとして扱うことの問題点」ということでお伝えしました。

競合リスクってそもそも何？
競合リスクがある場合の解決策3つ
競合リスクを考慮した解析であるGray検定をEZRで実践してみる

ということが理解できたのなら幸いです！

Cox比例ハザードモデルをわかりやすく解説！生存時間解析での多変量解析！

beat1115 — Mon, 17 Mar 2025 02:00:15 +0000

この記事では「Cox比例ハザードモデルをわかりやすく解説！生存時間解析での多変量解析！」ということでお伝えします。

Cox比例ハザードモデルは生存時間解析における多変量解析
比例ハザード性が重要
Cox比例ハザードモデルの結果はハザード比
論文でもハザード比とその95%信頼区間の推定のために使われる

といったことが理解できるようになりますので、ぜひ一緒に学んでいきましょう！

Cox比例ハザードモデルとは？共変量を考慮できる解析をわかりやすく解説

Cox比例ハザードモデルとは、生存時間解析で使われるモデル解析（いわゆる、回帰分析）です。

生存時間解析とは、「あるイベントが発生するまでの時間」をアウトカムにした時に使われる解析のこと。

三種の神器、とまでは言わないですが、生存時間解析ではこの3つは必ず理解すべき内容です。

ログランク検定
カプランマイヤー曲線
Cox比例ハザードモデル（Cox回帰）

ログランク検定とカプランマイヤー曲線はこちらの記事をご参照ください。

＞＞ログランク検定と一般化ウィルコクソン検定との違いは？

＞＞カプランマイヤー曲線について理解する！

Cox比例ハザードモデルはモデル解析なので、共変量を考慮できる多変量解析です。

そのため、「Cox比例ハザードモデル＝生存時間解析での多変量解析」とイメージしていただければOK。

ではちなみに、生存時間解析じゃない時のモデル解析は？と言われたらすぐに出てきますか？

アウトカムが連続変数の時：重回帰分析（共分散分析）
アウトカムがカテゴリカル変数の時：ロジスティック回帰分析

なので、ぜひ整理しておきましょう！

Cox比例ハザードモデルでは比例ハザード性が重要

Cox比例ハザードモデルを使う際に重要な知識としては、「比例ハザード性」があります。

そもそもハザードというのは、「単位時間あたりのイベント発生率」のこと。

そのハザードを群間比較しようとすると、ハザード比を使います。

そして比例ハザード性というのは、「2群間のハザード比が時間に限らず常に一定であること」を指します。

以下の場合のカプランマイヤー曲線は比例ハザード性が成立しています。

「薬を使った群が使っていない群よりも常に生存率が1.5倍だった」

反対に、以下の場合は比例ハザード性が成立していません。

「薬を使った群と使っていない群で、最初は生存率に差がなかったが、12ヶ月後以降は差がみられるようになった」

この場合、最初はハザード比が1倍でしたが、12ヶ月以降あたりからハザード比がかなり大きくなっています。

この場合ハザード比は時間によらず一定ではないので、比例ハザード性は成立しないのです。

Cox比例ハザードモデルの結果はハザード比を見る

Cox比例ハザードモデルは、生存時間解析でのモデル解析（多変量解析）であることがわかりました。

そして、Cox比例ハザードモデルを使う際には「比例ハザード性」が重要だということも理解できましたね。

その上で次に、Cox比例ハザードモデルを用いた解析の結果の見方を学んでいきましょう。

早速ですが、EZRでCox比例ハザードモデルを実施した場合、下記のような結果が出てきます。

の3つが出力されていることがわかりますね。

つまり、Cox比例ハザードモデルを実施した場合、メインとなる結果はハザード比である、ということです。

ハザード比の結果の見方は、リスク比やオッズ比との結果の見方と同じです。

比なので、分子と分母が同じ値であれば1になります。

つまり、ハザード比が1であれば群間差がない、1から遠ければ群間差あり、というような見方ですね。

Cox比例ハザードモデルが多変量解析として論文で使われている例

では最後に、論文でCox比例ハザードモデルが使われている例をみていきましょう。

生存時間解析では、「ログランク検定」「カプランマイヤー曲線」「Cox比例ハザードモデル」の3つは必ず理解しておく必要がある通り、生存時間解析の論文ではCox比例ハザードモデルは大抵使っています。

例えば、こちらの論文。

Methodを見ると以下のような記載があります。

「ハザード比と95%信頼区間を推定するためにCox比例ハザードモデルを使った」とあるので、まさに今までみてきたことですね。

そして結果の表としては、以下の通りになっています。

ハザード比
ハザード比の95%信頼区間
P値

と、EZRでCox比例ハザードモデルを実施した場合と同じ結果が論文に記載されています。

Cox比例ハザードモデルを使った論文では、これぐらいの結果を記載すればOKということですね。

まとめ

いかがでしたか？

この記事では「Cox比例ハザードモデルをわかりやすく解説！生存時間解析での多変量解析！」ということでお伝えしました。

Cox比例ハザードモデルは生存時間解析における多変量解析
比例ハザード性が重要
Cox比例ハザードモデルの結果はハザード比
論文でもハザード比とその95%信頼区間の推定のために使われる

といったことが理解できたのなら幸いです！

Cox比例ハザードモデルの特殊バージョンに、時間依存性の共変量を考慮したCox比例ハザードモデルもありますので、必要でしたらこちらのページもご覧ください。

こちらの内容は動画でもお伝えしておりますので、併せてご確認くださいませ。

ログランク検定と一般化ウィルコクソン検定とは？p値やカプランマイヤー曲線の解釈

beat1115 — Tue, 11 Mar 2025 05:00:15 +0000

生存時間解析で出てくる代表的な２種類のノンパラメトリック検定が、ログランク検定（Log-rank test）と一般化ウィルコクソン検定（Generalized Wilcoxon test）です。

この記事では、その2つの検定について解説します。

この記事を読めば、以下のことがわかるように！

ログランク検定の帰無仮説・対立仮説
ログランク検定でやっていることの概要
一般化ウィルコクソン検定の概要
ログランク検定と一般化ウィルコクソン検定との違い
ログランク検定と一般化ウィルコクソン検定の、それぞれ得意とする場面

それではいってみましょう！

ログランク検定はどんなデータを対象とした検定か？カプランマイヤーとセットで解析する

まずは、ログランク検定が対象とするデータです。

T検定は連続量を対象とした検定でしたよね。

カイ二乗検定はカテゴリカルデータを対象とした検定でした。

では、ログランク検定はどうでしょうか？

結論から言うと、ログランク検定は生存時間を対象とした検定です。

	T検定	カイ二乗検定	ログランク検定
対象データ	連続量	カテゴリカルデータ	生存時間

ログランク検定は生存時間解析で用いる検定手法です。

生存時間解析で可視化する方法は、カプランマイヤー曲線でしたね。

カプランマイヤー曲線のP値はログランク検定のP値であることがほとんど

ログランク検定は、カプランマイヤー曲線とセットで出てくることが多いです。

カプランマイヤー曲線にp値が記載されていたら、それはほぼログランク検定のp値であると認識しておいてよいでしょう。

例えば、下記の論文ではMethodに「Kaplan-Meier curves were calculated for time-to-event end points, with differences between arms tested at the overall 5% significance level by log-rank test.」とあり、ログランク検定のp値が記載されていることがわかります。

引用：Trastuzumab Plus Anastrozole Versus Anastrozole Alone for the Treatment of Postmenopausal Women With Human Epidermal Growth Factor Receptor 2–Positive, Hormone Receptor–Positive Metastatic Breast Cancer: Results From the Randomized Phase III TAnDEM Study

DOI: 10.1200/JCO.2008.20.6847

ログランク検定の帰無仮説と対立仮説は？

ログランク検定は統計的検定の１つであるため、当然ながら帰無仮説と対立仮説があります。

まずはそれを理解しておきましょう。

ログランク検定の帰無仮説と対立仮説はこちらです。（２群の場合）

帰無仮説：全ての時点で、２群の生存率は同じ
対立仮説：ある任意の時点で、２群の生存率は異なる

つまり、２群の生存率が同じかどうかを検定しているということ。

ログランク検定のP値が、事前に決めておいた有意水準よりも小さければ、生存率が２群で異なるという結論を導くことができます。

この解釈の仕方は、他の検定でも同じですね。

ログランク検定はノンパラメトリック検定

ログランク検定は、ノンパラメトリック検定の１つです。

ということは、検定をする際にデータの分布を仮定しない検定だということですね。

一方、生存時間解析で良く出てくるCox比例ハザードモデルは、セミパラメトリックな方法です。

その名の通り、各時点のハザード比が一定であることを仮定しているためです。

ログランク検定でやっていること

では、実際にログランク検定でやっていることは何だろう？と思いませんか。

それを解説していきます。

ログランク検定でやっていることを一言で表すと、これです。

イベントが起こるごとに２×２分割表を作成する

・・・これだけじゃわからないですよね。

なので、実際に例を見ていきましょう。

例を見ながらログランク検定の概要を知る

例えば、以下のようなデータがあったとします。

今回の例では、死亡がイベントです。

群	生存または打ち切りの時間（ヶ月）	死亡（１）なのか打ち切り（０）なのかの違い
実薬群	5	0
実薬群	7	0
実薬群	8	1
実薬群	12	0
プラセボ群	2	0
プラセボ群	3	1
プラセボ群	4	1
プラセボ群	10	0

このデータで、イベント（死亡）は３回起こっていますよね。

実薬群の８ヶ月目
プラセボ群の３ヶ月目
プラセボ群の４ヶ月目

この３つです。

この３つの時点で２×２分割表を作成します。

つまり、以下のような分割表が作成できます。

3ヶ月時点の分割表

3ヶ月目	死亡数	生存数	合計
実薬群	0	4	4
プラセボ群	1	2	3
合計	1	6	7

4ヶ月時点の分割表

4ヶ月目	死亡数	生存数	合計
実薬群	0	4	4
プラセボ群	1	1	2
合計	1	5	6

8ヶ月時点の分割表

8ヶ月目	死亡数	生存数	合計
実薬群	1	1	2
プラセボ群	0	1	1
合計	1	2	3

ここで注意していただきたいのが、分割表にある合計の数値は「その時点で追跡できている数」になるということ。

データでは実薬群が４例、プラセボ群も４例の計８例です。

ですが、表中の３ヶ月時点でのデータを見れば分かる通り、プラセボ群の合計が３例で、トータルの例数は７例です。

「あれ？プラセボ群は４例でトータル８例じゃなかった？」

と思いますよね。

なぜプラセボ群の１例がいなくなったかというと、２ヶ月時点で打ち切り症例が１例いるから。

初めてイベントが起こる３ヶ月時点より早い時点（２ヶ月目）で、プラセボ群の１例は追跡不能になったため、イベント発生時の分割表からは除かれているんです。

以上が、ログランク検定でやっていることの概要です。

ログランク検定の検定統計量はカイ二乗統計量の発展

ログランク検定でやっていることは、イベントが発生した時点で２×２分割表を作成することだと理解しました。

であれば、検定統計量はどうなるでしょうか？

分割表を作成すると、算出できる統計量がありますよね。

そう、カイ二乗統計量です。

そのため、ログランク検定でやっていることをまとめると以下の通りになります。

イベントが起こるごとに２×２分割表を作成し、カイ二乗統計量を算出してP値を出力している

一般化ウィルコクソンについて。ログランク検定との違いは？

一般化ウィルコクソン検定は、ログランク検定と同じ、生存時間を扱う解析手法です。

では、ログランク検定と一般化ウィルコクソン検定では何が違うのでしょうか。

実は、ほとんど違いがありません。

帰無仮説と対立仮説は、ログランク検定と同じで以下の通りです。（２群の場合）

帰無仮説：全ての時点で、２群の生存率は同じ
対立仮説：ある任意の時点で、２群の生存率は異なる

また、一般化ウィルコクソン検定もログランク検定も同様にノンパラメトリック検定です。

さらに、一般化ウィルコクソン検定でやっていることも「イベントが起こるごとに２×２分割表を作成し、カイ二乗統計量を算出してP値を出力している」ということなので、ログランク検定と同じですね。

唯一の違いがこれです。

ログランク検定と一般化ウィルコクソン検定では、カイ二乗統計量の計算の仕方が違う

一般化ウィルコクソン検定の考え方

一般化ウィルコクソン検定で重要となるたった１つの考え方があります。

それがこちら。

試験の最初は例数が多いため信頼性の高いデータになる。しかし、後ろになると例数が減るために信頼性の低いデータになる

例えば、100例生存していた中から20例死亡すると、「だいたい２割」と自信を持って言えそうですよね。

しかし、5例中1例死亡しても「だいたい２割」と本当に言えるのか？ということが疑問になります。

そのため例数の多く残っている、前の方の時点のデータを重要視するのです。

一方のログランク検定は、どの時点のデータでも平等に扱っています。

よって、ログランク検定と一般化ウィルコクソン検定の違いをまとめると以下の通りです。

ログランク検定ではどの時点のデータも平等に扱う。一方で一般化ウィルコクソン検定では、例数の多く残っている前の方の時点のデータを重要視して扱う

ログランク検定と一般化ウィルコクソン検定の使い分け

では次に知りたいことは、そのログランク検定と一般化ウィルコクソン検定の違いによって、どのような使い分けになるのか？ということです。

結論は以下の通り。

「時間がたてばたつほど、群間差が開いてくる」タイプのデータに対しては、一般化ウィルコクソン検定よりもログランク検定の方が、有意差がつきやすくなる。
一方、「結局ほぼ全員が死亡するのだけど、生存時間が延びる」タイプのデータでは、一般化ウィルコクソン検定の方が、差がつきやすくなる。

イメージとしては、以下の通りです。

上記のグラフのように、時間がたつほど曲線に差が出るのであれば、ログランク検定で有意差がつきやすいです。

上記のグラフのように、最初は差がつくけど最終的には同じになる場合、一般化ウィルコクソン検定で有意差がつきやすいです。

ただ、多くの論文を見ていると、一般化ウィルコクソン検定を実施している論文はほぼ皆無です。

そのため、ログランク検定を用いていれば問題ありません。

ログランク検定をEZRで実践する

ログランク検定をEZRで実践する方法を、別記事で解説しています。

EZRとは無料の統計ソフトであるRを、SPSSやJMPなどのようにマウス操作だけで解析を行うことができるソフトです。

EZRもRと同様に完全に無料であるため、統計解析を実施する誰もが実践できるソフトになっています。

2019年5月の時点で英文論文での引用回数が2400回を超えているとのことで、論文投稿するための解析ソフトとしても申し分ありません。

これを機に、EZRで統計解析を実施してみてはいかがでしょうか？

＞＞EZRでログランク検定を実践する。

ログランク検定に関するまとめ

ログランク検定とは、生存時間を対象としたノンパラメトリック検定である。
ログランク検定でやっていることは、イベントが起こるごとに２×２分割表を作成し、カイ二乗統計量を算出してP値を出力する、ということ。
一般化ウィルコクソン検定は、ログランク検定と同様に生存時間を解析する手法
ログランク検定では、どの時点のデータも平等に扱う。一方で一般化ウィルコクソン検定では、例数の多く残っている前の方の時点のデータを重要視して扱う
ログランク検定は時間がたてばたつほど、群間差が開いてくる」タイプのデータに対して有意差がつきやすくなり、一般化ウィルコクソン検定は「結局ほぼ全員が死亡するのだけど、生存時間が延びる」タイプのデータで有意差がつきやすくなる。

生存時間解析をわかりやすく解説！カプランマイヤー曲線や打ち切りとは？

beat1115 — Mon, 10 Mar 2025 00:00:30 +0000

臨床研究における統計手法としては、とてもメジャーになった生存時間解析。

カプランマイヤー曲線も有名で、生存時間解析とセットで出てきますよね。

がん領域で使われることの多い解析手法のため、「生存時間」という名称がとてもしっくりきます。

ですが実は、生存時間解析は「生存/死亡」データ以外にも適用可能。

このページでは、そんな生存時間解析やカプランマイヤー曲線をわかりやすく解説します。

生存時間解析とは？「イベント」と「時間」を解析するユニークな解析

生存時間解析を一言でいうと、その名の通り「時間」を解析する方法です。

時間は、「１時間」とか「７５日」とかですよね。

普通に考えると、連続量として扱って解析しても良さそうです。

連続量として扱えば、T検定やウィルコクソンの順位和検定を使えばいいですよね。

ではなぜわざわざ生存時間解析、というものを使うのでしょうか。

生存時間解析で重要なイベントという概念

なぜわざわざ生存時間解析を使う必要があるのか。

それを理解するためには、「イベント」という概念を理解する必要があります。

イベントの定義は「その研究内で１度だけ起こる事象」です。

例えば、「死亡」はイベントの定義に当てはまります。

２回以上死亡する人はいないからですね。

その他にも、「初回骨折」も１度だけ起こる事象です。

骨折は複数回起こる可能性がありますが、「初回」に限定すると１度しか起こりません。

そうなると「初回」をつければ何でもイベントになるか、と思いますよね。

・・・正解です！！

初回は、絶対１度しか起こりません。

なので、全部に「初回」をつけてしまえば、それはイベントになります。

初回の有害事象発現
初回の骨折
初回の感染症への観戦
etc…

では話を戻して、なぜ生存時間解析でイベントの概念が必要になるのか。

それは、生存時間解析が「イベントまでの時間」を扱う解析手法だからです。

生存時間解析でもう一つ重要な概念である打ち切り

生存時間解析で、イベントという概念が重要だと学びました。

もう一つだけ、重要な概念があります。

それは、「打ち切り」です。

打ち切りは教科書的に様々な定義がされていますが、ここでは誤解を恐れずに簡単に定義します。

打ち切りの定義は「イベントが起こっていないこと」です。

例を使いましょう。

例えば、イベントとして死亡を定義し、死亡までの時間を解析したいとします。

そして、試験の期間は２年間とします。

１０人を集めて試験をした時、２年後までに死亡してしまう方が３人いたとします。

そして５人が生存したまま試験期間を終了し、残りの２名が途中で何らかの理由で試験を辞めてしまいました。

その時に、それぞれ以下の３つのカテゴリに１０人を分けることができます。

死亡した人
死亡しておらず試験期間を完了した人
死亡しておらず試験期間完了前に辞めた人

この時、「死亡した人」はイベントを起こしたとして解析できます。

では、他の２つのカテゴリに入る人のデータは、どう扱えばよいでしょうか？

つまり、「死亡しておらず試験期間を完了した人」と「死亡しておらず試験期間完了前に辞めた人」は、どう扱うべきでしょうか？

データが得られた最後の時点を死亡として扱いますか？

でも死亡として扱うと、実際には生存しているので、現実とは異なるデータになってしまいます。

生存しているのに死亡していると扱ってしまうと、結果に偏り（バイアス）が出てしまいます。

そのため生存時間解析では、この「死亡しておらず試験期間を完了した人」と「死亡しておらず試験期間完了前に辞めた人」を「打ち切りデータ」として扱います。

イベントは起きていない。

でも、それ以降のデータはない。

そのため「得られているデータの時点まではイベントが起きていないデータ」として扱うことができます。

これを「打ち切りデータ」と呼んでいるのです。

生存時間解析は、打ち切りを考慮しながらイベントまでの時間を解析できる方法

以上の話をまとめると、生存時間解析はこのように言い換えることができます。

生存時間解析：打ち切りを考慮しながらイベントまでの時間を解析できる方法

例えば、全てのデータがイベントを起こしていて、打ち切りのデータが存在しない時。

この場合には、イベントまでの時間を連続量として扱い、T検定やウィルコクソンの順位和検定をすることも許されます。

だって、打ち切りがないので、別に難しい生存時間解析をしなくていいですよね。

なので生存時間解析では、「イベント」と「打ち切り」の両方のデータがある場合にとても便利な方法と言えます。

生存時間解析を可視化する：カプランマイヤー曲線

この生存時間解析に関して、可視化（グラフ）できる方法があります。

それは、カプランマイヤー曲線を描くことです。

上記のようなグラフですね。

カプランマイヤー曲線は、データを読み取るのにかなり有意義なグラフです。

そして、カプランマイヤー曲線を正確に読み取るには、先ほどの「イベント」と「打ち切り」を正確に理解する必要があります。

カプランマイヤー曲線の詳細はこちらをご覧ください。

＞＞カプランマイヤー曲線の書き方は？

生存時間をEZRで実践する

生存時間解析をEZRで実践する方法を、別記事で解説しています。

EZRとは無料の統計ソフトであるRを、SPSSやJMPなどのようにマウス操作だけで解析を行うことができるソフトです。

EZRもRと同様に完全に無料であるため、統計解析を実施する誰もが実践できるソフトになっています。

2019年5月の時点で英文論文での引用回数が2400回を超えているとのことで、論文投稿するための解析ソフトとしても申し分ありません。

これを機に、EZRで統計解析を実施してみてはいかがでしょうか？

＞＞EZRで生存時間解析を実践する。

まとめ

生存時間解析は、打ち切りを考慮しながらイベントまでの時間を解析できる方法。

イベントの定義は、１度だけ起こる事象。

打ち切りの定義は、イベントが起こっていないこと。

統計に関するご質問があれば、メルマガにご登録の上ご質問くださいませ！

＞＞メルマガ登録はこちら（無料プレゼントあります。）

生存時間解析に関して動画でも解説していますので、合わせてご確認いただけると理解が進むはずです。

比例ハザード性とは？検証方法と成立しない場合の対処法もわかりやすく紹介！

beat1115 — Tue, 10 Sep 2024 05:00:47 +0000

医学分野ではCox比例ハザードモデルという解析手法がよく使われます。

生存時間解析で2群の生存率を比較するときに非常に便利な解析なのですが、比例ハザード性というものが成立していないと使えません。

「比例ハザード性って何？」
「どうやって検証するの？」
「比例ハザード性が成立しない場合にはどうすればいいの？」

といった疑問を持つ人も多いのではないでしょうか。

本記事では比例ハザード性とは何か、その検証方法や成立しない場合の対処法について紹介します。

比例ハザード性とは？

そもそも比例ハザード性とは何でしょうか？

紐解いていきましょう！

比例ハザード性の定義

まずは比例ハザード性の定義を調べてみましょう。

共変量の2群間において、ハザード比が時間によらず一定であること。

統計WEBより

まだ分かりづらいですよね。

ハザード比とは一体何のことでしょうか？

ハザード比とはそもそも何？

ハザード比とは、2群のハザードの比のことです。

ここで「ハザードって何？」と思いますよね。

まずはハザードとは何か解説していきますね。

ハザードとは、単位時間におけるイベントの発生率を示します。

例えばある薬を使った群と使わなかった群で、数ヶ月の生存率を調べるとしましょう。

この場合、1ヶ月生存できた確率(1ヶ月後の生存者/現時点の生存者)をハザードと表現します。

ちなみにハザードは直訳で”危険”または”障害”という意味になります。

この2群間の生存率の比をハザード比と表現します。

比例ハザード性が成立するのはどんな時？

比例ハザード性とは、2群間のハザード比が時間に限らず常に一定であることです。

比例ハザード性が成立するのはどんな時なのか、先ほどの例を使ってみてみましょう。

以下の場合のカプランマイヤー曲線は比例ハザード性が成立しています。

「薬を使った群が使っていない群よりも常に生存率が1.5倍だった」

反対に、以下の場合は比例ハザード性が成立していません。

「薬を使った群と使っていない群で、最初は生存率に差がなかったが、12ヶ月後以降は差がみられるようになった」

この場合、最初はハザード比が1倍でしたが、12ヶ月以降あたりからハザード比がかなり大きくなっています。

この場合ハザード比は時間によらず一定ではないので、比例ハザード性は成立しません。

このようにデータによって比例ハザード性が成立したり、しなかったりするわけです。

生存曲線の作り方はEZRでカプランマイヤー曲線を作る！という記事をご覧ください。

比例ハザード性の検証方法

実は、比例ハザード性を検証する客観的な方法はまだ確立されていないというのが現状です。

実際に比例ハザード性の検証したい時は、以下の2通りの方法で可能です。

生存曲線を目視で確認する
層別log-logプロットの平行性を確認する

①生存曲線を目視で確認する

比例ハザード性を検証するなら、ひとまず生存曲線を確認する方法が一番おすすめです。

比例ハザード性が成立するかどうかは、先ほどの例のように生存曲線をみれば大体わかるからです。

生存曲線をグラフ化したときに、2群とも同じような下がり方をしていれば、比例ハザード性は成立していると考えていいでしょう。

反対に、片方の群だけ途中から明らかに下がり方が変わっている場合は、比例ハザード性が成立していないと考えましょう。

この場合そのままCox比例ハザード分析にかけることは出来ませんので、対策が必要です(後ほど解説します)。

②層別log-logプロットの平行性を確認する

①の方法よりももう少しちゃんと比例ハザード性を検証したいときは、層別log-logプロットというものを作り、平行性を確認しましょう。

これは生存時間関数の対数をとった後、符号を反転してもう一度対数をとった関数をプロットしたグラフです。

どうして回りくどい変換をするのは難しい話になるのでここでは割愛します。

ただ、この変換を行うことで比例ハザード性が成立する場合に2つの線が平行になるようになります。

比例ハザード性が成立しない場合は、線が交わったりして平行になりません。

ただこの方法も結局最後は目視での確認ですので、客観性があるとは言い難いです。

基本的には①の生存曲線を目視で確認して大きなズレがなければ比例ハザード性に問題はないと判断してOKでしょう。

比例ハザード性が成立しない場合にはどうすればいい？

比例ハザード性が成立しない変数は、Cox比例ハザードモデルに組み込むことができません。

その場合は、以下の対処法があります。

層別Cox比例ハザードモデルを使用する
時間依存共変量を取り込む
関数に非線形項を追加する

この内②と③は上級者向きですので、統計に詳しくない方は①の方法を検討するのが良いと思います。

層別Cox比例ハザードモデルとは？

層別Cox比例ハザードモデルとは、対象者をある共変量で何層かに分割してCox比例ハザードモデルにかける方法。

先ほどご説明したとおり、比例ハザード性が成立しない変数はモデルに加えられないため、あらかじめ層に分けてしまおうという考え方です。

例を使って考えていきましょう。

例えばある薬を使った群と使っていない群で生存率を調べたいときに、性別を共変量としてCox比例ハザードモデルに組み込みたいとしましょう。

しかし性別と生存率のハザード比が比例しませんでした。

この場合、全体の対象者をあらかじめ男性と女性の2層に分けておきます。

2層を別々に解析することで性別を共変量に組み込まずに解析ができるというわけです。

ちなみに今回は性別を使いましたが、年齢などで何層かに分けることも可能です。

ただしどのように層別化するか決まりはなく、恣意的(都合のいい結果が出るところで層を分ける)に分析ができてしまうという欠点があります。

層別Cox比例ハザードモデルを使う時は先行研究を参考にして、なるべくオーソドックスな分け方をするようにしましょう。

②と③については詳しい説明を省きますが、いずれも時間に比例しない変数を加える方法です。

②はそんな都合の良い変数を見つけなければなりませんし、③は作り出さなければなりません。

どちらも数学的な知識がないと失敗しやすい方法です。

たいていは層別モデルで対応できるため、初心者のうちは①の方法をおすすめします。

まとめ

最後におさらいをしましょう。

比例ハザード性とは時間に関係なくハザード比が一定であること
生存曲線をプロット(グラフ化)することで比例ハザード性を確認できる
比例ハザード性を確かめる客観的指標は確立されていない
比例ハザード性が成立しない場合は層別Cox比例ハザードモデルを使用する

Cox比例ハザード分析を使用した論文は多くありますが、比例ハザード性の検討を怠っている方は案外多いように感じています。

間違った結果を発表しないためにも、注意する癖をつけておきたいですね。

今回は比例ハザード性について解説させて頂きましたが、生存曲線解析について解説した記事がこちらにもありますので、よければ一緒にご覧ください。

最後までお読み頂きありがとうございました。

Number at Riskとは統計でどんな意味？累積生存率との関係

beat1115 — Fri, 28 Jun 2024 09:41:08 +0000

この記事では「Number at Riskとは統計でどんな意味？累積生存率との関係」ということでお伝えします。

カプランマイヤー曲線の下になんとなく数字がついているのを見たことがあるけど、どんな意味を持っているのかわからない。。。

という方もいらっしゃるのではないでしょうか。

Number at Riskがどんな意味を持つのか？
Number at Riskが累積生存率にどう影響を及ぼすのか

ということが理解できるようになりますよ！

Number at Riskとは？どんな意味を持つ？

Number at Riskは、生存時間解析で用いられる用語。

特に、カプランマイヤー曲線の下についている数字です。

例えば、下記のカプランマイヤー曲線でもNumber at Riskが出力されていますね。

Number at Riskは日本語では「リスク人数」と呼ばれていて、その直前の時点までに残っている人数を示しています。

生存時間解析はイベントが起こるまでの時間をアウトカムとします。

その際に、今後イベントを起こすリスクがある人数、という意味ですね。

例えば上記のカプランマイヤー曲線では、500日目のA群のNumber at Riskは19人。

500日目の直前まで、A群では19人が試験に残っている（今後イベントを起こすリスクがある）ということを意味しています。

そして、累積生存率を計算するための分母になる人数でもあります。

これは後ほどまた説明しますね。

Number at Riskから累積生存率はどう計算される？

Number at Riskは累積生存率を計算するための分母になる人数です。

これはどういうことか。

例を用いて考えてみましょう。

Number at Riskが累積生存率に及ぼす影響

以下の3つの状況を見てみます。

試験には3人参加しており、2人はイベントを起こし、1人は打ち切りだった場合、という想定。

打ち切りが発生する状況が違います。

この時に、解析結果がどうなるのか？を考えてみましょう。

状況1での解析結果

まずは状況1での解析結果。

結論から示すと、結果としてはこんな感じになります。

時点1の直前までは3人が参加しているので、Number at Riskは3。

そして、時点1では1名がイベントを起こしているため、残りは2人。

だから2/3の生存率ですね。

この時、分母はNumber at Riskであり、分子はイベントの非発生例、ということになります。

次に時点2。

時点2の直前までは2人が残っているので、Number at Riskは2。（1名は時点1でイベントを起こしているため）

そして、時点2では1名が打ち切りを起こしています。

この時、イベントを起こしている人は0人です。

なので、この時の累積生存率は、2/3*2/2=2/3となります。

それまでの生存率に、時点2の生存率を掛けたもの。

時点2の生存率は2/2であり、分母はNumber at Risk、そして分子はイベントの非発生例、です。

打ち切りは起こしていますが、イベントを起こして人はいないため、あくまで分子は2なのです。

次に時点3。

時点3の直前までは1人が残っているので、Number at Riskは1。（1名は時点1でイベントを起こしており、1名は時点2で打ち切りを起こしているため）

そして、時点3では1名がイベントを起こしているため、残りは0人。

だから2/3*0/1=0の累積生存率ですね。

この時、分母はNumber at Riskであり、分子はイベントの非発生例、ということになります。

このような計算をしてカプランマイヤー曲線が示されているのです。

状況2での解析結果

次に状況2での解析結果。

結論から示すと、結果としてはこんな感じになります。

時点1は状況1と同じなので、2/3でいいですよね。

じゃあ時点2はというと、直前までは2名いるため、Number at Riskは2でイベント発生が1名。

なので、2/3*1/2=1/3という累積生存率になります。

最後の時点3は打ち切り。

Number at Riskは相変わらず1ですが、時点3では打ち切りが発生して、イベントは発生していない。

なので、1/3*1/1=1/3という計算結果に。

そしてそれ以降の情報はありませんので、ここでカプランマイヤー曲線は終了、ということになります。

状況3での解析結果

最後に状況3での解析結果。

結論から示すと、結果としてはこんな感じになります。

時点1は打ち切りです。

なので、Number at Riskは相変わらず3ですが、時点1では打ち切りが発生して、イベントは発生していない。

だから、3/3=1というのが累積生存率です。

じゃあ時点2はというと、直前までは2名いるため、Number at Riskは2でイベント発生が1名。

だから、1*1/2=1/2という計算結果。

そして時点3は1名イベントを起こしています。

だから、1/2*0/1=0という累積生存率になるのです。

状況の違いでNumber at Riskや累積生存率はどう変化したか？

これまで3つの状況を見てきた通り、イベントが起こっても打ち切りが起こってもその後にリスク人数が減ることは同じでしたね。

そのため、3つの状況でNumber at Riskは全時点で同じ。

しかし、イベントなのか打ち切りなのかによって、累積生存率を計算する際の分子の数値が違います。

なので、その時点の生存率計算も異なるし、結果としてカプランマイヤー曲線も変わります。

まとめ

いかがでしたか？

この記事では「Number at Riskとは統計でどんな意味？累積生存率との関係」ということでお伝えしました。

Number at Riskがどんな意味を持つのか？
Number at Riskが累積生存率にどう影響を及ぼすのか

ということが理解できたのなら幸いです！

カプランマイヤー曲線、ログランク検定、Cox比例ハザードモデルは、生存時間解析の3種の神器と言ってもいいほど頻出しますので、ぜひ理解しましょう！

こちらの内容は動画でも解説していますので、併せてご確認くださいませ。

ハザード比をわかりやすく解説！リスク比やオッズ比とどう違う？

beat1115 — Wed, 01 May 2024 22:38:17 +0000

この記事は「ハザード比をわかりやすく解説！リスク比やオッズ比とどう違う？」ということでお伝えします！

ハザード比ってそもそもどんな指標なの？
ハザード比はリスク比やオッズ比とどう違う？
ログランク検定ではハザード比が出ないんだけどどうすれば良い？

といったことが理解できるようになります！

ハザード比をわかりやすく説明するとどんな指標？

ハザード比は「ハザード」の「比」なので、ハザード比を理解するには本質的に「ハザード」を理解する必要があります。

ハザードという指標は生存時間解析で使われている指標で、定義としては「単位時間あたりのイベント発生率」になります。

生存時間解析では「その被験者にイベントが起こったかどうか」と同時に「いつイベントが起こったのか」という「期間（時間）」の情報がすごく重要になるんです。

そのためハザードは、「期間（時間）」を考慮したイベント発生率の指標である、というイメージを持っていただければOKです。

ハザードがわかればハザード比は理解しやすい

ハザードが分かれば、ハザード比は理解しやすいです。

ハザード比はその名の通り、各群のハザードの「比」を取ったものだからです。

分子と分母が同じ値であればハザード比は1を取ります。

そのため、帰無仮説の値はハザード比（HR）＝1です。

通常は比較相手の群（標準治療群やプラセボ群）を分母として比を取るため、ハザード比が1より小さければ新薬群の方がイベントを起こしにくく、ハザード比が1より大きければ新薬群の方がイベントを起こしやすい、ということが分かります。

ハザード比はリスク比やオッズ比とどう違う？

ハザード比が理解できたところで、次なる疑問が出てくるかもしれないですね。

それは「ハザード比はリスク比やオッズ比とどう違うの？」という疑問。

リスク比とオッズ比に関してはこちらの記事で詳しく解説しているため、ある程度理解している前提で進みますね。

その違いを結論からお伝えすると、リスク比とオッズ比は「イベントの有無」だけを情報として扱っているのに対して、ハザード比はイベントの有無と「期間（時間）」を考慮しているという点が違いです。

ハザード比がリスク比やオッズ比と異なる点

リスク比とオッズ比は「イベントの有無」だけを情報として扱うのに対して、「時間」を考慮しているかどうかがハザード比との違い

しかし上記の違いがあることだけを理解しておけば、結果の見方などは両者に違いがありません。

つまり、比が1であれば群間に差がないですし、1から遠ければ群間差がある、という結果の見方は、ハザード比でもリスク比でもオッズ比でも同じ、ということです。

ハザード比、リスク比、オッズ比が解析結果に出力される回帰分析

ハザード比、リスク比、オッズ比はそれぞれどのような回帰分析の結果から出力されるでしょうか？

結論から言えば、下記の回帰分析になります。

各解析によって、得られる結果の推定値は変わりますので、研究の目的に応じてどの解析を実施するのか、決めなければなりません！

ログランク検定ではハザード比が出ない！どうやって解析すると出力できる？

ハザード比が生存時間解析で使われており、リスク比やオッズ比との違いも理解できたかと思います。

では次に、「ハザード比は実際の解析でどうやって出力すればいいのか？」という点について解説します。

生存時間解析で最も有名な解析手法といえば、ログランク検定ですよね。

ログランク検定でハザード比を出力できればいいのですが、実はログランク検定ではハザード比を推定できないのです。

実際にEZRでログランク検定を実施してみると、下記のような結果しか出力されません。

生存期間の中央値とその95%信頼区間、そして検定結果（P値）が出力されます。

それにプラスして、カプランマイヤー曲線も出力されます。

ログランク検定でハザード比を出力できないとなると、ハザード比はどうやって出力させればいいのでしょうか？

結論としては、Cox比例ハザードモデル（Cox回帰）でハザード比を出力させる必要があります。

実際に上記のログランク検定と同じデータに対して、EZRでCox比例ハザードモデル（Cox回帰）を実施すると、以下のような結果が出力されます。

ハザード比とその95%信頼区間、そして検定結果（P値）が出力されていることがわかります。

無事にハザード比を出力させることができましたね。

ログランク検定とCox比例ハザードモデルのP値が違う！どっちを使えばいいの？

もしかしたら気付いた方もいるかもしれませんが、ログランク検定とCox比例ハザードモデル（Cox回帰）のP値が異なっています。

もう一度、ログランク検定とCox比例ハザードモデルの結果を載せますね。

↓ログランク検定の結果

↓Cox比例ハザードモデルの結果

ログランク検定でのP値は0.092に対して、Cox比例ハザードモデルのP値は0.09577です。

若干ではありますが、違いますよね。

これは両者の解析手法が異なるために起こることです。

ログランク検定はノンパラメトリック検定の一つであるのに対して、Cox比例ハザードモデルは「比例ハザード性」を仮定した解析だからです。

「じゃあどっちのP値を使えばいいの！！？？？」と思いますよね。

これは、事前にどっちを使うか決めておく必要があります。

論文で多いのは、結果のP値はログランク検定で評価し、ハザード比を推定するためだけにCox比例ハザードモデルを使う、という記載です。

つまり、ログランク検定のP値を採用して、Cox比例ハザードモデルのP値は採用しない、というスタンス。

これはどっちが良い悪いという話ではないため、研究目的に応じて、研究者自身が決める必要があるのです。

まとめ

いかがでしたか？

この記事は「ハザード比とはリスク比とどう違う？ログランク検定では出力できないけどどうすれば良い？」ということでお伝えしました。

ハザード比ってそもそもどんな指標なの？
ハザード比はリスク比やオッズ比とどう違う？
ログランク検定ではハザード比が出ないんだけどどうすれば良い？

といったことが理解できたのなら幸いです！

こちらの内容は動画でも解説しておりますので、併せてご覧くださいませ。

時間依存性共変量を考慮したCox比例ハザードモデルとは？EZRでの実施例も解説！

beat1115 — Wed, 16 Aug 2023 03:03:42 +0000

この記事では「時間依存性共変量を考慮したCox比例ハザードモデルとは？EZRでの実施例も解説！」としてわかりやすく解説します。

時間依存性共変量とは？どんな例がある？
時間依存性共変量を考慮したCox比例ハザードモデルの例
時間依存性共変量を考慮したCox比例ハザードモデルをEZRで実施する

理解できるようになります。

ぜひご覧くださいませ！

時間依存性共変量とは？どんな例がある？

時間依存性共変量を理解する前に、まずは通常の共変量に関して整理しましょう！

通常の共変量はどんな前提を持っている？

通常、共変量（説明変数）というのは、背景因子の何かであることが一般的ですね。

その共変量に関して、どんな前提を持っているかというと、以下の3つのうちどれか。

ベースライン（研究開始時点）から変わらない前提
変わったとしても、全員一律変わる
変わったとしてもランダムに発生するから、群間比較の上では無視可能

1つ目の「ベースライン（研究開始時点）から変わらない前提」ですが、これは例えば性別や成人における身長。

性別は研究期間中に変わることは考えられませんし、成人であれば身長が大幅に伸びるということも考えられません。

2つ目の「変わったとしても、全員一律変わる」に関しては、例えば年齢。

どんな人でも1年で1歳分だけ歳をとりますので、それなら共変量としては特に考える必要はありません。

3つ目の「変わったとしてもランダムに発生するから、群間比較の上では無視可能」というのは、例えば体重や血圧の増減。

例えば研究の期間が1年だったとして、1年もあれば体重や血圧は変動する可能性はあります。

しかし、それは群間で偏った増減ではなく、どの群でもランダムに起こりうる増減であれば、群間比較をする上では無視可能。

だから、ベースラインの1点のみ考えればOK、という考え方です。

時間依存性の共変量とは？

では時間依存性の共変量とはどんなものでしょうか。

それは、通常の共変量の考え方がどうしてもできない共変量のこと。

つまり、「研究期間中に全員が一律変化するわけではない」し「ランダムに変わるわけではなく、その変化がアウトカムに著しく影響を及ぼす」という共変量です。

一言で言えば「アウトカムに影響を与える因子が時間とともに変化する」時に、その因子は時間依存性の共変量といえます。

後述する論文では、「ニルマトレルビル治療を受けたかどうか」というのが時間依存的に変化し、その変化を解析上考慮したい、という目的を持っています。

時間依存性共変量を考慮したCox比例ハザードモデルの例

では、実際に時間依存性共変量を考慮したCox比例ハザードモデルの例を見てみましょう。

こちらの論文では、時間依存性共変量を考慮したCox比例ハザードモデルが使われています。

（引用：https://www.nejm.org/doi/full/10.1056/NEJMoa2204919）

下記の通り、ニルマトレルビル治療の有無が研究期間中に変化してしまう状況、ということです。

結果の解釈などは原著を見ていただければと思いますが、通常のCox比例ハザードモデルの解釈の仕方で問題ありません。

時間依存性共変量を考慮したCox比例ハザードモデルをEZRで実施する

では最後に、時間依存性共変量を考慮したCox比例ハザードモデルをEZRで実施する方法をお伝えします。

どこで実施できるかというと、「統計解析　＞　生存期間の解析　＞時間依存性変数を含む生存期間に対する多変量解析（Cox比例ハザード回帰）」です。

解析をする上で、通常のCox比例ハザードモデルをEZRで実施する場合と同じ点と異なる点を把握しておきましょう。

青で囲んだ部分は、通常のCox比例ハザードモデルをEZRで実施する場合と同じ点です。

一方で、赤で囲んだ部分が、時間依存性共変量を考慮したCox比例ハザードモデルで独特の指定場所になります。

EZRで時間依存性共変量を考慮したCox比例ハザードモデルを実施するためのデータの作りかた

じゃあこの赤で囲んだ部分を指定するには、データの中に「時間依存性変数が変わるまでの時間」を追加する必要があるということです。

ここからは書籍「EZRでやさしく学ぶ医療統計」に付与されるデモデータを用いて解説するのですが、下記の図の通り「時間依存性変数が変わるまでの時間」をデータに付与します。

実際のデータを見ると、下記の通り。

DaysHCが「イベントまでの時間」ですが、それの他にDaysGVHD24という「時間依存性変数が変わるまでの時間」がデータに付与されていることがわかります。

時間依存性変数が研究期間中に変わる場合には「イベントまでの時間」と「時間依存性変数が変わるまでの時間」が異なりますが、時間依存性変数が変わらない症例は二つの時間は一致します。

実際にEZRで時間依存性共変量を考慮したCox比例ハザードモデルを実施する

ではデータが用意できたら、解析を実施します。

「統計解析　＞　生存期間の解析　＞時間依存性変数を含む生存期間に対する多変量解析（Cox比例ハザード回帰）」を選択。

下記の通り、上の部分にはイベントの有無と、イベントまでの時間を指定します。

そして、時間依存性変数が変わるまでの時間を、下の方で指定します。

この状態でOKを押すと、解析結果が出力されます。

この結果から、急性移植片対宿主病（GVHD）なしより、急性移植片対宿主病（GVHD）ありの方がイベント（出血性膀胱炎）が発症しやすい、ということが言えます。

EZRで時間依存性共変量を考慮したCox比例ハザードモデルを実施した時にEZRが解析プロセスでやっていること

上記の通り、EZRを用いることで、簡単に時間依存性共変量を考慮したCox比例ハザードモデルを実施することができました。

でも、解析のプロセスがちょっとブラックボックスな感じがして「本当に大丈夫？」という、何となくのモヤモヤがある方もいるかもしれません。

そのため、ここからはEZRが解析プロセスの中でやっていることを解説しますね。

実は、時間依存性変数を含む生存期間に対する多変量解析（Cox比例ハザード回帰）を実施するとTempTDというデータが作られることがわかります。

そのTempTDを見てみると、以下のように時間依存性の共変量が変わった症例は、2行になっていることがわかります。

そして、新たに「Start日（変数名：start_td）」「Stop日（変数名：stop_td）」「共変量が0か1か（変数名：DaysGVHD24_td）」という3つの変数が作成されていることがわかります。

そして、EZRの出力でRのプログラムを見ると、Start日とStop日を考慮してCox回帰を実施していることがわかります。

そして、説明変数には新たに作成された「共変量が0か1か（変数名：DaysGVHD24_td）」が指定されています。

そのため、EZRでは解析プロセスとして「Start日（変数名：start_td）」「Stop日（変数名：stop_td）」「共変量が0か1か（変数名：DaysGVHD24_td）」という3つの変数を作成し、これらを考慮してCox回帰を実施していることがわかります。

まとめ

いかがでしたか？

この記事では「時間依存性共変量を考慮したCox比例ハザードモデルとは？EZRでの実施例も解説！」としてわかりやすく解説しました。

時間依存性共変量とは？どんな例がある？
時間依存性共変量を考慮したCox比例ハザードモデルの例
時間依存性共変量を考慮したCox比例ハザードモデルをEZRで実施する

を理解していただけたのなら嬉しいです！

こちらの内容は動画でも解説しておりますので、併せてご確認くださいませ。