<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>わかりやすい生存時間解析 &#8211; いちばんやさしい、医療統計</title>
	<atom:link href="https://best-biostatistics.com/category/surviv/feed" rel="self" type="application/rss+xml" />
	<link>https://best-biostatistics.com</link>
	<description>数式にとらわれない、イメージとしての統計！</description>
	<lastBuildDate>Tue, 14 Oct 2025 00:15:30 +0000</lastBuildDate>
	<language>ja</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	<generator>https://wordpress.org/?v=6.9.4</generator>

<image>
	<url>https://best-biostatistics.com/wp/wp-content/uploads/2024/04/cropped-Data-Seed-Inc.-logo-I-32x32.png</url>
	<title>わかりやすい生存時間解析 &#8211; いちばんやさしい、医療統計</title>
	<link>https://best-biostatistics.com</link>
	<width>32</width>
	<height>32</height>
</image> 
<atom:link rel="hub" href="https://pubsubhubbub.appspot.com"/>
<atom:link rel="hub" href="https://pubsubhubbub.superfeedr.com"/>
<atom:link rel="hub" href="https://websubhub.com/hub"/>
<atom:link rel="self" href="https://best-biostatistics.com/category/surviv/feed"/>
	<item>
		<title>初心者必見！左側打ち切りとAndersen-Gillモデルを正しく使うためのコツ</title>
		<link>https://best-biostatistics.com/surviv/left-truncation-andersen-gill-model.html</link>
					<comments>https://best-biostatistics.com/surviv/left-truncation-andersen-gill-model.html#respond</comments>
		
		<dc:creator><![CDATA[beat1115]]></dc:creator>
		<pubDate>Wed, 20 Aug 2025 01:20:53 +0000</pubDate>
				<category><![CDATA[わかりやすい生存時間解析]]></category>
		<guid isPermaLink="false">https://best-biostatistics.com/?p=8563</guid>

					<description><![CDATA[<p><img src="https://best-biostatistics.com/wp/wp-content/uploads/2025/08/統計のYoutubeアイキャッチ-36-1024x576.jpg" class="webfeedsFeaturedVisual" /></p>「Coxモデルでは解析できないって、どういうこと……？」 生存時間解析の定番といえばCox比例ハザードモデルですが、現実のデータはそんなに単純ではありません。 例えば、再発が何度も起きる疾患や、研究に参加する前からリスク [&#8230;]]]></description>
										<content:encoded><![CDATA[<p><img src="https://best-biostatistics.com/wp/wp-content/uploads/2025/08/統計のYoutubeアイキャッチ-36-1024x576.jpg" class="webfeedsFeaturedVisual" /></p>
<p>「Coxモデルでは解析できないって、どういうこと……？」</p>



<p>生存時間解析の定番といえばCox比例ハザードモデルですが、現実のデータはそんなに単純ではありません。</p>



<p>例えば、<strong>再発が何度も起きる疾患</strong>や、研究に参加する前からリスクが始まっていた人（＝左側打ち切り）など、1回だけのイベントに収まらないケースは少なくありません。</p>



<p>そんなときに力を発揮するのが、<strong>Andersen-Gill（AG）モデル</strong>です。</p>



<p>本記事では、「左側打ち切りとは何か？」「Coxモデルではなぜ対応できないのか？」「Andersen-Gillモデルの考え方と実装方法」までを、<strong>統計初学者でも理解できるように、やさしく・ていねいに解説</strong>していきます。</p>



<p>Rでのサンプルコード付きなので、<strong>再発データの解析を始めたい人にも実践的な一歩</strong>となる内容です。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">左側打ち切りデータとは何か？</h2>



<p><a href="https://best-biostatistics.com/surviv/survival.html" data-type="post" data-id="56">生存時間解析</a>というと、一般には「ある出来事がいつ起きるか」を予測・説明する統計手法のことを指します。</p>



<p>たとえば「がん患者が再発するまでの期間」「機械が故障するまでの稼働時間」など、イベントのタイミングに注目します。</p>



<p>ですが実際のデータ収集では、全ての事象を最初から最後まで観察できるとは限りません。そんな現実に対応するために生まれた概念が、「<a href="https://best-biostatistics.com/surviv/survival.html" data-type="post" data-id="56">打ち切り（censoring）</a>」です。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading"> 打ち切りデータとは？3つの分類を押さえよう</h3>



<p>まず前提として、<strong><span style="text-decoration: underline;">「打ち切り」とは“いつイベントが起きたのか正確にわからない”という情報</span></strong>のことです。生存時間解析では、この打ち切りのタイプをしっかり理解しておくことがとても重要です。</p>



<p>主に以下の3種類があります。</p>



<ol class="wp-block-list has-swl-main-thin-background-color has-background">
<li><strong>右側打ち切り（Right-censoring）<br></strong>最もよく使われる打ち切りです。ある対象者について、観察期間中にイベントが<strong>まだ起きていない</strong>ため、「いつ起きるか」はわからない。<br>例：調査終了時点でまだ再発していない患者。<br></li>



<li><strong>左側打ち切り（Left-censoring or truncation）</strong><strong><br></strong>観察を開始した時点で、<strong>すでにイベントが起きていた可能性がある</strong>が、いつ起きたかは不明。<br>例：健康診断で糖尿病と診断されたが、いつから糖尿病だったか不明。<br></li>



<li><strong>区間打ち切り（Interval-censoring）</strong><strong><br></strong> イベントがある期間内に起きたことはわかるが、<strong>正確な時点がわからない</strong>。<br>例：年1回の健康診断で、前回は異常なし、今回は陽性＝その間に発症した。</li>
</ol>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading"><strong>左側打ち切りが起きやすい状況とは？</strong></h3>



<p>左側打ち切りは、<strong>過去の履歴を持つ被験者や対象者を途中から観察する場面</strong>でよく発生します。以下のようなケースを想像すると、理解しやすいかと思います。</p>



<p><strong>臨床研究の例<br></strong>ある研究が「心疾患の初発までの期間」を調べるものだとします。ところが、すでに症状を経験している患者も、研究参加時には「治療中」や「経過観察中」だった場合、いつ心疾患が起きたかが記録されていないことがあります。</p>



<p>このように「いつ発症したか」がわからないデータが含まれると、<strong>初発までの正確な時間が不明</strong>になります。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading"><strong>なぜ左側打ち切りが分析を難しくするのか？</strong></h3>



<p>左側打ち切りがあると、「本来の観察開始時点が欠けている」ことになります。</p>



<p>つまり、<strong>生存時間（eventまでの時間）を過小評価してしまう可能性がある</strong>のです。</p>



<p>たとえば、ある患者が研究参加前に糖尿病を発症していたとします。</p>



<p>でも私たちは「参加時点で糖尿病である」ことしか知らないので、「糖尿病になったのは、研究に参加してから」と誤解してしまうリスクがあります。</p>



<p>これは生存時間解析の根幹――<strong>「イベントの発生時刻と、それに至る時間をどう扱うか」</strong>――において、非常に深刻なズレを生む原因になります。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading">左側打ち切りデータは、<strong>Coxモデルでは対応できない？</strong></h3>



<p><a href="https://best-biostatistics.com/surviv/cox.html" data-type="post" data-id="5433">Cox比例ハザードモデルは、右側打ち切りには標準的に対応できますが、左側打ち切りには対応できません。</a>なぜなら、モデルが前提としているのは、「全ての対象が同じ基準時点（スタート）から追跡される」という条件だからです。</p>



<p>この前提が崩れると、ハザード比の推定やサンプルの扱いにバイアスが生じ、<strong>誤った因果関係や効果の大きさ</strong>が導かれてしまう恐れがあります。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading"><strong>左側打ち切りを完全に避けるのは難しい</strong></h3>



<p>現実のデータ分析では、完璧な情報を持った「理想的な被験者」ばかりを揃えることはできません。特にレトロスペクティブ研究（過去の記録に基づく研究）や、電子カルテのような“途中から収集されたデータ”では、左側打ち切りは避けがたい問題です。</p>



<p>ここで登場するのが、再発や時間依存共変量を扱える「Andersen-Gillモデル」です。このモデルを使えば、<strong>観察開始時点を“0”とし、そこからの再発イベントを扱う</strong>という構造がとれるため、左側打ち切りの影響を最小限に抑えることが可能です。</p>



<p>言い換えれば、<strong><span style="text-decoration: underline;">「本当のスタート時点が不明でも、観察開始からのデータを活かしてモデル化する」</span></strong>柔軟な方法を与えてくれるのです。</p>



<p>左側打ち切りデータは、「すでにイベントが起きていたかもしれないけど、それがいつだったのか不明」という、実務上とてもよくあるデータ状況です。そしてこれに対応するには、単純なCoxモデルでは不十分。<strong>再発や時間依存性を考慮した解析手法</strong>の出番です。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">Cox比例ハザードモデルでは足りない場面</h2>



<p>生存時間解析の代表的な手法といえば、やはり「Cox比例ハザードモデル」が有名です。多くの教科書でも最初に登場し、RやPythonなどの統計ソフトにも標準で実装されています。</p>



<p>では、なぜこのCoxモデルだけでは不十分な場面があるのでしょうか？</p>



<p>この章では、Coxモデルの基本を復習したうえで、現実のデータにおける「限界」と、それを補う必要性について丁寧に解説します。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading"><strong>Coxモデルとは？ざっくり復習</strong></h3>



<p>Cox比例ハザードモデル（Cox Proportional Hazards Model）は、生存時間と共変量の関係を調べるためのモデルです。</p>



<p>このモデルのポイントは、「<strong>特定の変数がハザード（イベントが起きる確率）にどの程度影響するか</strong>」を、ハザード比（Hazard Ratio, HR）という形で示せることです。</p>



<p>ここでの「比例」とは、「リスクの形は変えずに高さだけを変える」＝共変量が時間によらず一定の影響を持つ、という意味です。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading"><strong>現実には「1回で終わらないイベント」も多</strong>い</h3>



<p>さて、ここで想像してみてください。たとえば次のようなデータです。</p>



<ul class="wp-block-list has-swl-main-thin-background-color has-background">
<li><strong>がんの再発を追う医療研究</strong></li>



<li><strong>うつ病の再発調査</strong></li>



<li><strong>工場での機械トラブル（何度も壊れる）</strong></li>



<li><strong>企業の従業員が何度も休職するケース</strong></li>
</ul>



<p>これらはいずれも「1人（あるいは1台、1事象）につき、複数回イベントが起きる」タイプのデータです。</p>



<p>ところが、<span class="swl-marker mark_orange">Coxモデルではこのような「複数回のイベント（recurrent events）」には<strong>原則として対応できません</strong>。</span></p>



<p>なぜなら、Coxモデルの基本的な単位は「1人あたり1回のイベントを記録する」というものだからです。</p>



<p>たとえば、<span class="swl-marker mark_orange">1人の患者が3回再発した場合、Coxモデルでは最初の再発しか扱えず、それ以降の再発データは無視されてしまいます</span>。これでは、せっかくの貴重なデータを捨ててしまうことになりますよね。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading"><strong>「時間とともに変わる変数」にも対応しにくい</strong></h3>



<p>もうひとつ、Coxモデルの限界として挙げられるのが、「<strong><a href="https://best-biostatistics.com/surviv/time-dependent-cox.html" data-type="post" data-id="6451">時間依存性共変量（time-dependent covariates）</a></strong>」の取り扱いです。</p>



<figure class="wp-block-image"><img decoding="async" width="1316" height="791" src="https://best-biostatistics.com/wp/wp-content/uploads/2023/08/ScreenShot-2023-08-14-9.23.34.png" alt="" class="wp-image-6453" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2023/08/ScreenShot-2023-08-14-9.23.34.png 1316w, https://best-biostatistics.com/wp/wp-content/uploads/2023/08/ScreenShot-2023-08-14-9.23.34-300x180.png 300w, https://best-biostatistics.com/wp/wp-content/uploads/2023/08/ScreenShot-2023-08-14-9.23.34-1024x615.png 1024w, https://best-biostatistics.com/wp/wp-content/uploads/2023/08/ScreenShot-2023-08-14-9.23.34-768x462.png 768w" sizes="(max-width: 1316px) 100vw, 1316px" /></figure>



<p>現実のデータでは、治療内容や生活習慣、環境条件などが時間とともに変化することは珍しくありません。たとえば：</p>



<ul class="wp-block-list has-swl-main-thin-background-color has-background">
<li>「途中から薬を飲み始めた」</li>



<li>「退院して在宅療養に切り替わった」</li>



<li>「会社の制度が変わった」</li>
</ul>



<p>このような変化があると、共変量が時間の経過とともに変わってしまい、単純なCoxモデルでは“1つの値”として入力できません。</p>



<p>これを無視すると、推定に大きな誤差が生じたり、リスクの因果関係を見誤る恐れがあります。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading"><strong>左側打ち切りとCoxモデルの相性</strong></h3>



<p>さらに、前のセクションでも解説した「左側打ち切り」もCoxモデルにとっては厄介です。</p>



<p>Coxモデルは、「全員が同じ時点から観察されている（＝スタートが揃っている）」という前提で設計されています。そのため、観察開始前にすでにイベントが起きていたかもしれない人（＝左側打ち切り）を含めると、<strong>生存時間の計算がおかしくなってしまう</strong>のです。</p>



<p>結果として、解析対象から外さざるを得ず、サンプルサイズが減ったり、バイアスが生じたりすることもあります。</p>



<p>このように、Coxモデルは生存時間解析の基本中の基本ではありますが、現実のデータ構造――特に次のような状況――には対応が難しいです。</p>



<ul class="wp-block-list has-swl-main-thin-background-color has-background">
<li>1人が複数回イベントを経験する（再発）</li>



<li>時間とともに変わる共変量を扱いたい（処置・環境）</li>



<li>左側打ち切りが存在する（初発タイミングが不明）</li>
</ul>



<p>これらの課題に柔軟に対応できるモデルとして登場したのが、<strong>Andersen-Gillモデル</strong>です。</p>



<p>このモデルはCoxモデルの枠組みを活かしつつ、時間依存性や再発を「カウントプロセス」としてモデル化することで、より複雑な現実のデータに対応することができます。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">Andersen-Gillモデルって何？ざっくり解説</h2>



<p>前のセクションで、Cox比例ハザードモデルには「1回限りのイベントしか扱えない」「時間とともに変化する変数に弱い」といった限界があることを解説しました。</p>



<p>現実のデータには、1人の患者が何度も再発したり、環境や治療状況が変化したりするケースが数多くあります。</p>



<p>そうした複雑な状況に対応するために開発されたのが、<strong>Andersen-Gill（AG）モデル</strong>です。</p>



<p>このセクションでは、AGモデルが何を解決してくれるのか、Coxモデルとどう違うのか、初心者でも理解しやすいようにやさしく紹介します。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading"><strong>Andersen-Gillモデルとは？</strong></h3>



<p>Andersen-Gill（AG）モデルは、<strong>再発や複数イベントを解析するための拡張Coxモデル</strong>です。</p>



<p>1970年代末にAndersenとGillによって提案され、Coxモデルの考え方をベースにしつつ、「1人の対象に複数のイベントが起きる」ことを前提に設計されています。</p>



<p>最大の特徴は、「Counting Process（カウントプロセス）」という考え方を取り入れている点です。</p>



<p>これは、<strong><span class="swl-marker mark_orange">1人の対象を“時間帯ごとのイベントのまとまり”として捉えるアプローチ</span></strong>であり、時間依存性共変量や複数イベントにも対応可能です。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading"><strong>Andersen-Gill（AG）モデルはどんな場面で使えるの？</strong></h3>



<p>AGモデルは、以下のような<strong>繰り返しイベント</strong>のある研究にとても適しています。</p>



<ul class="wp-block-list has-swl-main-thin-background-color has-background">
<li>医療：がんや心疾患の再発、再入院、感染症の再感染</li>



<li>メンタルヘルス：うつ病エピソードの再燃</li>



<li>行動研究：犯罪者の再犯や交通違反の再発生</li>



<li>ビジネス：ユーザーのサービス再利用、顧客の離脱と復帰</li>



<li>工業・IT：機械の再故障、システム障害の再発</li>
</ul>



<p>どれも1回で終わるわけではなく、<strong>複数回発生しうる</strong>イベントですよね。AGモデルは、まさにこういった「繰り返し」の構造をモデルとして自然に取り入れることができるのです。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading">Andersen-Gill（AG）モデルは<strong>データの構造がカギ：「start-stop」形式</strong></h3>



<p>AGモデルでは、Coxモデルと異なり、<strong>1人のデータを複数行に分割して記録</strong>する必要があります。</p>



<p>たとえば、1人の患者が3回再発した場合、次のような構造になります。</p>



<figure class="wp-block-table"><table class="has-fixed-layout"><tbody><tr><td><strong>id</strong></td><td><strong>start</strong></td><td><strong>stop</strong></td><td><strong>event</strong></td><td><strong>treatment</strong></td></tr><tr><td>1</td><td>0</td><td>50</td><td>1</td><td>0</td></tr><tr><td>1</td><td>50</td><td>100</td><td>0</td><td>1</td></tr><tr><td>1</td><td>100</td><td>150</td><td>1</td><td>1</td></tr></tbody></table></figure>



<p>このように、「start」から「stop」までの期間を1単位として、各期間でイベントが発生したか（event = 1）を記録します。</p>



<p>治療内容（treatment）などの共変量も、期間ごとに変更できます。これにより、「時間依存性共変量」も自然に組み込むことができます。</p>



<p>AGモデルの根本的な考え方は、Coxモデルの数式に基づきつつ、「再発イベントも含めて、全部“1つのデータ”としてまとめて解析する」というアプローチです。</p>



<p>1人の対象に複数のイベントがあると、それらは<strong>独立ではありません</strong>。最初の再発が次の再発に影響を及ぼすことはよくあります。</p>



<p>AGモデルでは、この依存性に対応するために、<strong>「クラスタリング（cluster）」というテクニック</strong>を用います。</p>



<p><strong><span class="swl-marker mark_orange">Rで実装する際には、cluster(id)のように指定することで、個人ごとのイベントの相関を考慮し、標準誤差の過小評価を防ぐことができます</span></strong>。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading">Andersen-Gill（AG）モデルは<strong>左側打ち切りにも強い</strong></h3>



<p>AGモデルは、「観察開始時点からの再発イベントを扱う」という構造を取るため、<strong>左側打ち切りにもある程度対応できます</strong>。</p>



<p>たとえば、すでに糖尿病を発症している患者が研究に参加した場合、その人の「初発」はわかりませんが、「参加後の再発」は記録できます。</p>



<p>AGモデルは、そういった“再発だけ”を扱う設計なので、<strong>左側打ち切りの人も解析対象として含めやすい</strong>のです。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading"><strong>Andersen-Gillモデルの使いどころと注意点</strong></h2>



<p>ここまでで、Andersen-Gill（AG）モデルが「再発や時間依存性共変量に強い」という特徴を持つことがわかってきました。</p>



<p>しかし、「このモデルは便利そうだから、とりあえず使えばOK！」というわけではありません。</p>



<p>すべてのケースで万能ではないからこそ、「どんなときにAGモデルを使うべきか？」「どんな点に注意すべきか？」をしっかり押さえておくことが大切です。</p>



<p>このセクションでは、他のモデルとの比較を交えながら、AGモデルの<strong>適用場面と注意点</strong>について丁寧に解説していきます。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading"><strong>まずは整理：似ているけど違うモデルたち</strong></h3>



<p>繰り返しイベントのあるデータを扱う手法はいくつかあります。Andersen-Gillモデルはその一つにすぎません。以下のような他の方法ともよく比較されます。</p>



<figure class="wp-block-table"><table class="has-fixed-layout"><tbody><tr><td><strong>モデル名</strong></td><td><strong>対応できる特徴</strong></td><td><strong>主な想定</strong></td></tr><tr><td><strong><a href="https://best-biostatistics.com/surviv/cox.html" data-type="post" data-id="5433">Cox比例ハザードモデル</a></strong></td><td>イベント1回／時間依存性×</td><td>最初の発症まで</td></tr><tr><td><strong><a href="https://best-biostatistics.com/surviv/time-dependent-cox.html" data-type="post" data-id="6451">時間依存性Coxモデル</a></strong></td><td>イベント1回／時間依存性◯</td><td>処置や環境が変わる場合</td></tr><tr><td><strong>Andersen-Gillモデル</strong></td><td>イベント複数／時間依存性◯</td><td>再発・複数事象があるとき</td></tr><tr><td><strong><a href="https://best-biostatistics.com/correlation_regression/negative-binomial.html" data-type="post" data-id="5639">負の二項回帰モデル</a></strong></td><td>回数に対応／時間無視</td><td>期間内のイベント回数だけを知りたい場合</td></tr></tbody></table></figure>



<p>AGモデルは、「繰り返しイベント × 時間情報を重視 × 処置の影響も調べたい」といった分析に最適です。</p>



<p>逆に言えば、「イベントは1回しか起こらない」または「イベントの回数だけ知りたい」場合には、他のモデルの方が適していることもあります。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading"><strong>Andersen-Gillモデルを使う際の注意点</strong></h3>



<p>便利なAGモデルですが、注意すべき点もいくつか存在します。とくに次のようなポイントは、初心者でも押さえておくべき重要な項目です。</p>



<h4 class="wp-block-heading"><strong>イベント間の独立性を仮定している（が、実際は依存している）</strong></h4>



<p>AGモデルは、1人の対象におけるイベント（例：再発1回目、2回目、3回目）を、<strong>統計的に独立しているものとして扱います</strong>。しかし実際には、1回目の再発が2回目のリスクに影響を与えることはよくありますよね？</p>



<p>この「イベント間の依存性」がモデルに無視されるため、標準誤差が過小評価されやすいという問題があります。これを補うためには、cluster(id)で個体ごとの相関を考慮する必要があります。</p>



<h4 class="wp-block-heading"><strong>全体の“ハザード構造”は共有される</strong></h4>



<p>AGモデルでは、<strong>すべての再発が同じ“ハザード構造”に従う</strong>と仮定されます。つまり、「1回目の再発」と「3回目の再発」では、基本的なモデル構造は変わらないとみなされます。</p>



<p>しかし、現実には再発を繰り返すほど病状が重くなったり、対応が変わったりすることもあります。そういった「イベントごとの変化」をモデルに入れたいときには、<strong>PWPモデルやfrailtyモデル</strong>といった別のアプローチが必要です。</p>



<h4 class="wp-block-heading"><strong>観察期間の分割が必須で、データ加工が大変</strong></h4>



<p>AGモデルでは、「start–stop形式」で時間を分割したデータを準備する必要があります。これには手間がかかる上、<strong>観察期間の分け方に迷う</strong>こともあります。特に時間依存性共変量が複雑になると、手動でのデータ構築が面倒になる可能性があります。</p>



<p>この点は、事前に計画を立ててスクリプト化しておくと作業効率が上がります。</p>



<h4 class="wp-block-heading"><strong>解釈には丁寧さが求められる</strong></h4>



<p>AGモデルの出力結果は、Coxモデルと同様に「ハザード比（HR）」として出てきます。ただし、1人あたり複数のイベントを対象としているため、<strong>そのHRが示す意味合いも少し複雑になります</strong>。</p>



<p>たとえば、「治療Aがハザードを30%下げる」という結果が出た場合、それは再発全体に対する効果であり、1回目か2回目かを区別した効果ではありません。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">RでAndersen-Gillモデルを実装する</h2>



<p>ここまでで、Andersen-Gillモデルの理論や使いどころについて詳しく学んできました。では、実際に<strong>Rでこのモデルをどのように実装すればよいのか？</strong> 初心者にもわかりやすく、具体的なコード例とあわせて解説していきます。</p>



<p>ポイントは、「start–stop形式でのデータ構造」と「cluster()による個体内相関の考慮」です。</p>



<p>Andersen-Gillモデルは、Rの標準的な生存時間解析パッケージである**survival**に組み込まれています。まずは必要なライブラリを読み込みましょう。</p>



<pre class="wp-block-code"><code>install.packages("survival")&nbsp; # 初回のみ
library(survival)</code></pre>



<p>次に、AGモデルを使うには、データを「start–stop形式」に整える必要があります。これは、<strong>時間区間ごとに行を分けて記録する形式</strong>です。</p>



<p>例として、以下のような再発データを想定しましょう。50例分のサンプルデータを作成しています。</p>



<p><a href="https://best-biostatistics.com/wp/wp-content/uploads/2025/08/AG_sample_data.csv">データはこちらからダウンロードできます。</a></p>



<figure class="wp-block-image size-full is-resized"><img decoding="async" width="778" height="554" src="https://best-biostatistics.com/wp/wp-content/uploads/2025/08/ScreenShot-2025-08-20-10.01.46.png" alt="" class="wp-image-8564" style="width:500px" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2025/08/ScreenShot-2025-08-20-10.01.46.png 778w, https://best-biostatistics.com/wp/wp-content/uploads/2025/08/ScreenShot-2025-08-20-10.01.46-300x214.png 300w, https://best-biostatistics.com/wp/wp-content/uploads/2025/08/ScreenShot-2025-08-20-10.01.46-768x547.png 768w" sizes="(max-width: 778px) 100vw, 778px" /></figure>



<p>このように、<strong>1人の対象者が複数行で表されている</strong>点が重要です。それぞれの行が、ある期間中の情報（start〜stop）を記録しています。</p>



<p>生存時間のオブジェクトには Surv() を使います。AGモデルでは「start, stop, event」の形式を取り、coxph() で回帰を実行します。</p>



<pre class="wp-block-code"><code>cox_model &lt;- coxph(
&nbsp;&nbsp;Surv(start, stop, status) ~ treatment + cluster(id),
&nbsp;&nbsp;data = example_data #example_dataという名前でRにインポートしている場合
)

summary(cox_model)</code></pre>



<p><strong>ポイント：</strong></p>



<ul class="wp-block-list has-swl-main-thin-background-color has-background">
<li>Surv(start, stop, status)：期間型のSurvオブジェクト（イベントの発生を時系列で表現）</li>



<li>cluster(id)：同じ対象者（id）内の相関を考慮し、標準誤差の過小評価を防ぐ</li>



<li>treatment：共変量（時間依存性を含めることも可能）</li>
</ul>



<p>summary(cox_model) を実行すると、以下のような出力が得られます：</p>



<figure class="wp-block-image size-full"><img decoding="async" width="512" height="117" src="https://best-biostatistics.com/wp/wp-content/uploads/2025/08/ScreenShot-2025-08-20-10.04.08.png" alt="" class="wp-image-8566" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2025/08/ScreenShot-2025-08-20-10.04.08.png 512w, https://best-biostatistics.com/wp/wp-content/uploads/2025/08/ScreenShot-2025-08-20-10.04.08-300x69.png 300w" sizes="(max-width: 512px) 100vw, 512px" /></figure>



<p>この結果は、「treatmentを受けた期間は、受けていない期間に比べて<strong>再発のハザードが2.2%上昇</strong>する」という意味になります（HR = 1.022）。<strong>exp(coef)</strong> がハザード比です。</p>



<p>ここで注意してほしいのは、これは「再発全体に対する平均的な影響」であり、「1回目だけ」とか「2回目に特化した効果」ではない点です。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading"><strong>時間依存性共変量も使える</strong></h3>



<p>たとえば、treatment が「途中から開始される」ような状況では、行ごとに値を変えれば、<strong>時間依存性共変量</strong>として自動的に反映されます。</p>



<p>これはCoxモデルでも Surv(start, stop, status) 形式を使えば可能ですが、<strong>イベントが1回しか扱えない</strong>という制限があるため、AGモデルの方がより柔軟です。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">Q&amp;A：よくある質問に答えます</h2>



<p>ここまでで、Andersen-Gillモデルの理論、使いどころ、実装方法まで学んできました。</p>



<p>しかし、初学者が実際に解析を始めようとすると、ふとした疑問や混乱にぶつかることも少なくありません。</p>



<p>このセクションでは、講義や実務の現場で<strong>よく出る質問</strong>をピックアップし、丁寧に回答していきます。初心者がつまずきやすいポイントを一つずつ整理して、理解を深めていきましょう。</p>



<h3 class="wp-block-heading"><strong>Q1. Andersen-Gillモデルでも「ハザード比（HR）」で結果が出てくるの？</strong></h3>



<p>&#x2705; <strong>はい、出てきます。</strong></p>



<p>Andersen-Gillモデルは、Coxモデルの拡張形です。そのため、回帰係数の解釈はCoxモデルと同じく「ハザード比（HR）」として表現されます。</p>



<p>ただし、対象が「1回きりのイベント」ではなく「複数の再発を含む全イベント」になっている点が異なります。つまり、得られるハザード比は「<strong>全体として再発しやすいかどうか</strong>」を評価しており、特定の再発順（1回目／2回目など）に限定された効果ではありません。</p>



<p>例：treatmentのHRが0.65 → 治療中は再発のリスクが<strong>全体的に</strong>35%下がると解釈します。</p>



<h3 class="wp-block-heading"><strong>Q2. Cox回帰も </strong><strong>Surv(start, stop, event)</strong><strong> で時間依存共変量を扱えるけど、AGモデルとどう違うの？</strong></h3>



<p>&#x2705; <strong>最大の違いは、「複数回のイベントを扱えるかどうか」です。</strong></p>



<p>Coxモデルでも Surv(start, stop, status) 形式を使えば、時間依存共変量（たとえば、治療を途中で変更するなど）を扱うことができます。</p>



<p>ただし、Coxモデルは基本的に「1人につき1回のイベント」までしか扱いません。複数のイベントがある人については<strong>最初のイベント以外を無視してしまう</strong>のが原則です。</p>



<p>一方、AGモデルは「1人につき何回でもイベントを記録して良い」構造になっており、<strong>再発や反復事象を解析する際には必須</strong>のモデルです。</p>



<h4 class="wp-block-heading"><strong>Q3. 「左側打ち切り」って、結局どう扱えばいいの？</strong></h4>



<p>&#x2705; <strong>“初発はわからないけど、再発からは観察できる”場合に強いのがAGモデルです。</strong></p>



<p>左側打ち切りとは、「研究参加時点ですでにイベントが起きていたかもしれないが、その時点がわからない」状態です。</p>



<p>Coxモデルでは、<strong>スタート時点が揃っていない人を除外する</strong>必要がありますが、AGモデルでは<strong>再発イベントから解析を始める</strong>構造にできるため、「初発が不明でも再発があれば使える」＝<strong>実質的に左側打ち切りにも対応可能</strong>というメリットがあります。</p>



<p>例：初めてのうつ病発症が不明でも、再発時点から記録すればAGモデルに含められる。</p>



<h4 class="wp-block-heading"><strong>Q4. 再発イベントの回数だけに注目したいなら、AGモデルじゃなくてもよい？</strong></h4>



<p>&#x2705; <strong>はい、その場合は「負の二項回帰モデル」などのカウントデータモデルの方がシンプルです。</strong></p>



<p>AGモデルは「時間と再発の関係」や「治療の効果」を時間軸上で評価するモデルです。もし、再発の<strong>タイミングではなく“回数だけ”を分析したい</strong>のであれば、Poisson回帰や負の二項回帰モデルの方が向いています。</p>



<p>ただし、これらのモデルでは時間依存性やイベントの順序は無視されるため、「時間の経過が重要」「再発の間隔を評価したい」場合はAGモデルが優れています。</p>



<h4 class="wp-block-heading"><strong>Q5. Andersen-Gillモデルで、イベント間の依存関係はどう処理されている？</strong></h4>



<p>&#x2705; <strong>厳密には“していない”。cluster()で補正をかける必要があります。</strong></p>



<p>AGモデルは、「1人の中の複数のイベントは統計的に独立である」という仮定を置いています。実際には、再発1回目の影響が2回目に波及するような依存関係がありますよね。</p>



<p>この“依存性”を補正するために、cluster(id) を指定することで、<strong>標準誤差にロバストな修正</strong>をかけることができます。これは必須ではありませんが、<strong>実務ではほぼ必須</strong>と思ってください。</p>



<h4 class="wp-block-heading"><strong>Q6. Andersen-Gillモデルって難しそう。初心者でも使うべき？</strong></h4>



<p>&#x2705; <strong>「タイミング」「再発」「処置の変更」に興味があるなら、挑戦すべきです。</strong></p>



<p>たしかにAGモデルは、Coxモデルよりも準備や理解が難しい部分があります。特に「データをstart–stop形式に整える作業」は最初はハードルに感じるかもしれません。</p>



<p>ですが、そのハードルを乗り越えることで、</p>



<ul class="wp-block-list has-swl-main-thin-background-color has-background">
<li>現実の複雑なデータに対応できる</li>



<li>有効な再発予測ができる</li>



<li>時間依存性をモデルに反映できる</li>
</ul>



<p>という<strong>強力なスキルセットが手に入ります</strong>。</p>



<p>実際、多くの医療研究や社会データ分析ではAGモデルが使われており、「実践的な統計解析スキル」として身につけておく価値は非常に大きいです。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading"><strong>まとめ：繰り返す現象と時間の流れを、見落とさずに捉えるために</strong></h2>



<p>生存時間解析と聞くと、まず思い浮かぶのはCox比例ハザードモデル。しかし、現実のデータはもっと複雑です。人は何度も病気を再発し、機械は何度も壊れ、状況は時間とともに変わっていきます。</p>



<p>そんな「1回きりでは終わらない現象」と「変化し続ける世界」を丁寧に捉えるためには、<strong>Andersen-Gillモデル</strong>という視点がとても有効です。</p>



<p>このモデルの強みは以下の通りです：</p>



<ul class="wp-block-list">
<li>複数のイベント（再発）を1人あたり複数回扱える</li>



<li><strong>時間依存性共変量</strong>（途中で処置が変わるなど）に対応できる</li>



<li><strong>左側打ち切り</strong>の人もデータに含めやすい</li>



<li><strong>Rでの実装が可能</strong>で、Coxモデルの延長線上で使える</li>
</ul>



<p>一方で、すべての問題を自動で解決してくれる「魔法のモデル」ではありません。イベント間の依存性、モデルの前提、データ整形の負荷など、注意すべき点も確かに存在します。</p>



<p>ですが、そうした点を理解したうえでAGモデルを選び、適切に使いこなせるようになると、<strong>あなたの統計解析の幅は格段に広がる</strong>でしょう。</p>



<p>時間と再発が交差するデータを前にしたとき、この記事の内容を思い出して、柔軟な分析と解釈に役立てていただければ幸いです。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>こちらの内容はYoutubeでも解説しております。</p>



<p>ぜひこちらの動画をご覧くださいませ。</p>



<figure class="wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio"><div class="wp-block-embed__wrapper">
<iframe title="初心者必見！左側打ち切りとAndersen Gillモデルを正しく使うためのコツ" width="500" height="281" src="https://www.youtube.com/embed/LTLIW-3fcNc?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>
</div></figure>
]]></content:encoded>
					
					<wfw:commentRss>https://best-biostatistics.com/surviv/left-truncation-andersen-gill-model.html/feed</wfw:commentRss>
			<slash:comments>0</slash:comments>
		
		
			</item>
		<item>
		<title>C統計量（C-index）とは？意味・計算方法・AUCとの違いをわかりやすく解説</title>
		<link>https://best-biostatistics.com/surviv/c-statistics-c-index-guide.html</link>
					<comments>https://best-biostatistics.com/surviv/c-statistics-c-index-guide.html#respond</comments>
		
		<dc:creator><![CDATA[beat1115]]></dc:creator>
		<pubDate>Sat, 09 Aug 2025 03:28:43 +0000</pubDate>
				<category><![CDATA[わかりやすい生存時間解析]]></category>
		<guid isPermaLink="false">https://best-biostatistics.com/?p=8545</guid>

					<description><![CDATA[<p><img src="https://best-biostatistics.com/wp/wp-content/uploads/2025/08/統計のYoutubeアイキャッチ-28-1024x576.png" class="webfeedsFeaturedVisual" /></p>「C統計量ってAUCと何が違うの？」 統計や機械学習に触れた人なら、一度は疑問に思ったことがあるかもしれません。 特に医療や金融の分野では、AUCと並んでC統計量（またはC-index）がよく登場しますが、初めて耳にした [&#8230;]]]></description>
										<content:encoded><![CDATA[<p><img src="https://best-biostatistics.com/wp/wp-content/uploads/2025/08/統計のYoutubeアイキャッチ-28-1024x576.png" class="webfeedsFeaturedVisual" /></p>
<p>「C統計量ってAUCと何が違うの？」</p>



<p>統計や機械学習に触れた人なら、一度は疑問に思ったことがあるかもしれません。</p>



<p>特に医療や金融の分野では、AUCと並んでC統計量（またはC-index）がよく登場しますが、初めて耳にした人には馴染みが薄い指標です。</p>



<p>実はC統計量とC-indexは<strong>ほぼ同じ指標</strong>であり、呼び方が分野によって異なるだけです。</p>



<p>この記事では、そんな混乱しがちなC統計量について、以下の流れでわかりやすく解説します。</p>



<ul class="wp-block-list">
<li>C統計量（C-index）の基本的な意味と役割</li>



<li>ROC曲線やAUCとの違いと関係性</li>



<li>計算方法とプログラミングでの実装例</li>



<li>C統計量を利用する際に注意すべきポイント</li>
</ul>



<p>特に、C統計量は<strong>「予測の順序の正確さ」</strong>を測る指標であることが特徴です。</p>



<p>これは単なる的中率とは異なり、モデルが高い確率で正しい順序付けを行えているかを評価するもので、2値分類から生存時間解析まで幅広く使えます。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">C統計量（C-index）とは？基本の定義</h2>



<p>C統計量（C-statistics）とは、予測モデルが「対象を正しく順位づけできる能力」を数値化した指標です。</p>



<p>例えば、がん患者の生存期間を予測するモデルがあったとします。</p>



<p>このとき、患者Aの予測生存期間が患者Bより長いとモデルが判断し、実際にAのほうが長生きだった場合、それは「順序が正しい（concordant）」といえます。</p>



<p>このような<strong><span class="swl-marker mark_orange">予測と実際の結果が一致する割合を集計したものがC統計量</span></strong>です。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading">C統計量とC-indexの関係</h3>



<p>結論から言うと、<strong>C統計量とC-indexは同じ指標</strong>です。</p>



<p>どちらも「Concordance index（適合指数）」の概念を指しており、計算方法や解釈は変わりません。</p>



<p>ただし、使われる場面や分野によって呼び方が異なる傾向があります。</p>



<div class="swell-block-capbox cap_box"><div class="cap_box_ttl"><span>C統計量とC-indexという用語が使われる場面</span></div><div class="cap_box_content">
<ul class="wp-block-list">
<li><strong>C統計量（C-statistics）</strong><br>主に医療統計や臨床研究の論文で用いられる。ROC曲線のAUCとほぼ同義として説明されることも多い。</li>



<li><strong>C-index（Concordance index）</strong><br>生存時間解析（Cox比例ハザードモデルなど）や機械学習分野でよく使われる呼び名。観測中に打ち切られたデータにも対応可能。</li>
</ul>
</div></div>



<p>このように、呼び方は異なりますが「予測の順序をどれだけ正しく当てられるか」を表すという本質は変わりません</p>



<p>したがって、論文やコードを読む際には、「C統計量＝C-index」と考えて差し支えありません。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading">C統計量は0〜1の範囲を取る</h3>



<p>C統計量は<strong>0から1の範囲</strong>で表されます。</p>



<ul class="wp-block-list">
<li><strong>1.0</strong> → 完全一致（すべてのペアで予測順序が正しい）</li>



<li><strong>0.5</strong> → ランダム予測と同等（識別能力がない）</li>



<li><strong>0.0</strong> → 完全に逆順（予測がすべて外れている）</li>
</ul>



<p>実務では、0.7以上であれば「まずまず信頼できる」、0.8を超えると「かなり良いモデル」とされることが多いです。</p>



<p>ただし、これはあくまで目安であり、分野や課題によって基準は変わります。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">C統計量とROC曲線・AUCとの違い</h2>



<p><a href="https://best-biostatistics.com/contingency/roc-curve.html" data-type="post" data-id="3217">ROC曲線（Receiver Operating Characteristic curve）</a>は、分類モデルの性能を視覚的に評価するためのグラフです。</p>



<p>横軸に<strong>偽陽性率（False Positive Rate）</strong>、縦軸に<strong>真陽性率（True Positive Rate）</strong>を取り、さまざまな閾値（しきい値）でモデルを動かしたときの点をつなぎます。</p>



<figure class="wp-block-image size-large is-resized"><img decoding="async" width="1024" height="1024" src="https://best-biostatistics.com/wp/wp-content/uploads/2025/08/roc_auc_example_en_corrected-1024x1024.png" alt="" class="wp-image-8546" style="width:500px" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2025/08/roc_auc_example_en_corrected-1024x1024.png 1024w, https://best-biostatistics.com/wp/wp-content/uploads/2025/08/roc_auc_example_en_corrected-300x300.png 300w, https://best-biostatistics.com/wp/wp-content/uploads/2025/08/roc_auc_example_en_corrected-150x150.png 150w, https://best-biostatistics.com/wp/wp-content/uploads/2025/08/roc_auc_example_en_corrected-768x768.png 768w, https://best-biostatistics.com/wp/wp-content/uploads/2025/08/roc_auc_example_en_corrected.png 1200w" sizes="(max-width: 1024px) 100vw, 1024px" /></figure>



<p>この<a href="https://best-biostatistics.com/contingency/roc-curve.html" data-type="post" data-id="3217">ROC曲線の下の面積を計算したものが<strong>AUC（Area Under the Curve）</strong></a>です。</p>



<p>AUCは0〜1の範囲で表され、1に近いほどモデルの識別能力が高いことを意味します。</p>



<p>0.5であれば、モデルがランダム予測と同等であることを示します。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading">C統計量とAUCの関係</h3>



<p>C統計量は、実は<strong>二値分類モデルにおいてはAUCと全く同じ値</strong>になります。</p>



<p>なぜなら、AUCは「ランダムに選んだ陽性サンプルと陰性サンプルのペアで、モデルが陽性のほうを高く予測できる確率」を表し、これはC統計量の定義と一致するからです。</p>



<p>しかし、C統計量は<strong><a href="https://best-biostatistics.com/surviv/survival.html" data-type="post" data-id="56">生存時間解析</a>や順位データにも適用できる</strong>という点でAUCより汎用性があります。</p>



<p>特に、生存時間データでは観測が途中で打ち切られる「<a href="https://best-biostatistics.com/surviv/survival.html" data-type="post" data-id="56">打ち切り（censoring）</a>」がよく発生しますが、C統計量はこの打ち切りを考慮して計算できます。一方、AUCは通常、二値分類問題に限定されます。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>まとめると：</p>



<ul class="wp-block-list">
<li><strong>二値分類問題 → C統計量 ＝ AUC</strong></li>



<li><strong>生存時間解析 → C統計量がAUCの一般化版</strong></li>
</ul>



<p><strong>C統計量はAUCを包括する概念</strong>であり、二値分類では同じになります。</p>



<p>しかし<strong><span class="swl-marker mark_orange">生存時間解析や打ち切りデータを扱う場合にはC統計量が必要になる</span></strong>ということです。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">C統計量の計算方法</h2>



<p>C統計量は、<strong>「予測が実際の結果の順序と一致している確率」</strong>を求めるだけです。</p>



<p>具体的には、全ての対象ペア（2人組）を比較し、モデルが予測した順序と実際の結果を比べます。</p>



<p>例えば、生存時間解析で患者Aと患者Bを比較したとき：</p>



<ol class="wp-block-list has-swl-main-thin-background-color has-background">
<li>Aの予測リスクがBより低く、かつAが実際に長く生存 → 順序一致（Concordant）</li>



<li>Aの予測リスクがBより高いのに、Aが長く生存 → 順序不一致（Discordant）</li>



<li>生存時間が同じ、または予測スコアが同じ → タイ（Tie）</li>
</ol>



<p>C統計量は、<strong>一致ペアの数＋0.5×タイの数</strong> を全ペア数で割ることで求められます。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading">C統計量の実際の計算式</h3>



<p>C統計量の計算式はこのようになります。</p>



<figure class="wp-block-image size-full"><img decoding="async" width="638" height="148" src="https://best-biostatistics.com/wp/wp-content/uploads/2025/08/ScreenShot-2025-08-09-11.51.04.png" alt="" class="wp-image-8547" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2025/08/ScreenShot-2025-08-09-11.51.04.png 638w, https://best-biostatistics.com/wp/wp-content/uploads/2025/08/ScreenShot-2025-08-09-11.51.04-300x70.png 300w" sizes="(max-width: 638px) 100vw, 638px" /></figure>



<p>ここで：</p>



<ul class="wp-block-list">
<li><strong>Concordant pairs</strong> = 順序が正しいペアの数</li>



<li><strong>Ties</strong> = 同点のペアの数</li>



<li><strong>All comparable pairs</strong> = 比較可能な全ペアの数（打ち切りがある場合は除外）</li>
</ul>



<p>生存時間解析の場合、打ち切りデータに対しては「比較可能かどうか」を判定し、比較できないペアは計算から除きます。</p>



<p>これが、C統計量がAUCよりも柔軟に使える理由です。</p>



<h3 class="wp-block-heading">RでC統計量を計算する例</h3>



<p>実際にRでもC統計量は簡単に作成できます。</p>



<p>ここでは、Survivalパッケージに含まれる「lung」というデータでC統計量を計算してみます。</p>



<pre class="wp-block-code"><code># survivalパッケージを読み込み
library(survival)

# lungデータを確認
head(lung)

# Cox比例ハザードモデルを作成
# time = 生存時間（日）
# status = 1: 生存, 2: 死亡 → Surv()内では死亡を1とする必要があるため status-1
cox_model &lt;- coxph(Surv(time, status == 2) ~ age + sex + ph.ecog, data = lung)

# モデルの概要を表示
summary(cox_model)

# C統計量の計算
c_stat &lt;- concordance(cox_model)
c_stat</code></pre>



<p>上記のプログラムを実行すると、C統計量は0.6371と計算することができました。（Concordance=0.6371の部分です。）</p>



<figure class="wp-block-image size-full is-resized"><img decoding="async" width="932" height="362" src="https://best-biostatistics.com/wp/wp-content/uploads/2025/08/ScreenShot-2025-08-09-11.56.11.png" alt="" class="wp-image-8548" style="width:500px" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2025/08/ScreenShot-2025-08-09-11.56.11.png 932w, https://best-biostatistics.com/wp/wp-content/uploads/2025/08/ScreenShot-2025-08-09-11.56.11-300x117.png 300w, https://best-biostatistics.com/wp/wp-content/uploads/2025/08/ScreenShot-2025-08-09-11.56.11-768x298.png 768w" sizes="(max-width: 932px) 100vw, 932px" /></figure>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">C統計量を使うときの注意点</h2>



<p>C統計量はペア比較に基づくため、サンプル数が少ないと評価が不安定になりやすいです。</p>



<p>特に、生存時間解析で打ち切りデータが多い場合、比較可能なペア数が極端に減り、C統計量が信頼できない数値になることがあります。</p>



<p>こうした場合は、<strong><a href="https://best-biostatistics.com/summary/bootstrap.html" data-type="post" data-id="5257">ブートストラップ法</a></strong>などを使って<a href="https://best-biostatistics.com/summary/95ci.html" data-type="post" data-id="33">信頼区間（Confidence Interval）</a>を算出し、不確実性を明示するのが望ましいです。</p>



<p>論文やレポートでも、C統計量単独ではなく「C=0.72（95% CI: 0.68–0.76）」のように提示されるのが一般的です。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>また、C統計量は順位の正しさを評価しますが、モデルの<strong>絶対的な予測精度</strong>や<strong>キャリブレーション（予測確率の適切さ）</strong>は測れません。</p>



<p>例えば、C統計量が高くても、予測確率そのものが全体的に過大評価されている可能性があります。こうした場合、キャリブレーションプロットなど、別の評価指標も併用すべきです。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">まとめ</h2>



<p>この記事では、C統計量（C-statistics）とC-indexについて、その意味、計算方法、AUCとの違いまでを解説しました。</p>



<p>ここで改めて、重要なポイントを整理しましょう。</p>



<ol class="wp-block-list has-swl-main-thin-background-color has-background">
<li><strong>C統計量とは？</strong>
<ul class="wp-block-list">
<li>モデルが予測した順位と実際の結果がどれだけ一致しているかを測る指標。</li>



<li>値は0〜1の範囲で、0.5はランダム予測と同等、1に近いほど性能が高い。</li>
</ul>
</li>



<li><strong>C統計量とC-indexの関係</strong>
<ul class="wp-block-list">
<li>中身は同じ指標で、分野によって呼び方が異なるだけ。</li>



<li>医療統計では「C統計量」、機械学習や生存時間解析では「C-index」と呼ばれる傾向。</li>
</ul>
</li>



<li><strong>AUCとの違い</strong>
<ul class="wp-block-list">
<li>二値分類ではC統計量＝AUC。</li>



<li>生存時間解析や打ち切りデータではC統計量がAUCを一般化した形として機能する。</li>
</ul>
</li>



<li><strong>計算方法</strong>
<ul class="wp-block-list">
<li>全ての比較可能なペアに対して順序が正しいかを判定し、その割合を求める。</li>



<li>Rで簡単に計算可能</li>
</ul>
</li>



<li><strong>注意点</strong>
<ul class="wp-block-list">
<li>データの偏りで過大評価の恐れ。</li>



<li>サンプル数不足で結果が不安定に。</li>



<li>他の指標と併用することが必須。</li>
</ul>
</li>
</ol>



<hr class="wp-block-separator has-alpha-channel-opacity"/>



<p>C統計量は、「モデルが予測の順序をどれだけ正しく当てられるか」を測るシンプルかつ強力な指標です。</p>



<p>特に、生存時間解析やリスク評価のように、単なる的中率では捉えきれない場面で真価を発揮します。</p>



<p>一方で、万能な指標ではありません。</p>



<p>データの質や構造を無視して数値だけを追いかけると、誤った結論にたどり着く危険もあります。</p>



<p>ですから、C統計量を使うときは、必ず<strong>他の評価指標や専門知識と組み合わせて判断する</strong>ことを忘れないでください。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>こちらの内容はYoutubeでも解説しております。</p>



<p>ぜひこちらの動画をご覧くださいませ。</p>



<figure class="wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio"><div class="wp-block-embed__wrapper">
<iframe title="C統計量（C-index）はAUCとどう違う？Rでも計算できる？" width="500" height="281" src="https://www.youtube.com/embed/E_qjiD2x4HI?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>
</div></figure>
]]></content:encoded>
					
					<wfw:commentRss>https://best-biostatistics.com/surviv/c-statistics-c-index-guide.html/feed</wfw:commentRss>
			<slash:comments>0</slash:comments>
		
		
			</item>
		<item>
		<title>競合リスクとGray検定とは？打ち切りとして扱うことの問題点</title>
		<link>https://best-biostatistics.com/surviv/finegray-test.html</link>
					<comments>https://best-biostatistics.com/surviv/finegray-test.html#comments</comments>
		
		<dc:creator><![CDATA[beat1115]]></dc:creator>
		<pubDate>Mon, 24 Mar 2025 06:00:48 +0000</pubDate>
				<category><![CDATA[わかりやすい生存時間解析]]></category>
		<guid isPermaLink="false">https://best-biostatistics.com/?p=5522</guid>

					<description><![CDATA[<p><img src="https://best-biostatistics.com/wp/wp-content/uploads/2023/08/Youtubeアイキャッチ-7-1024x576.jpg" class="webfeedsFeaturedVisual" /></p>この記事では「競合リスクとGray検定とは？打ち切りとして扱うことの問題点」ということでお伝えしていきます。 生存時間解析を学ぶと「競合リスク」という用語にぶつかることがあります。 ということを理解できるようになりますよ [&#8230;]]]></description>
										<content:encoded><![CDATA[<p><img src="https://best-biostatistics.com/wp/wp-content/uploads/2023/08/Youtubeアイキャッチ-7-1024x576.jpg" class="webfeedsFeaturedVisual" /></p>
<p>この記事では「競合リスクとGray検定とは？打ち切りとして扱うことの問題点」ということでお伝えしていきます。</p>



<p>生存時間解析を学ぶと「競合リスク」という用語にぶつかることがあります。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<ul class="wp-block-list">
<li><strong>競合リスクってそもそも何？</strong></li>



<li><strong>競合リスクがある場合の解決策3つ</strong></li>



<li><strong>競合リスクを考慮した解析であるGray検定をEZRで実践してみる</strong></li>
</ul>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>ということを理解できるようになりますよ！</p>



<h2 class="wp-block-heading">競合リスクとは？</h2>



<figure class="wp-block-image"><img decoding="async" width="2560" height="1350" src="https://best-biostatistics.com/wp/wp-content/uploads/2021/12/AdobeStock_339409725-scaled-e1638913182732.jpeg" alt="" class="wp-image-5419" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2021/12/AdobeStock_339409725-scaled-e1638913182732.jpeg 2560w, https://best-biostatistics.com/wp/wp-content/uploads/2021/12/AdobeStock_339409725-scaled-e1638913182732-300x158.jpeg 300w, https://best-biostatistics.com/wp/wp-content/uploads/2021/12/AdobeStock_339409725-scaled-e1638913182732-1024x540.jpeg 1024w, https://best-biostatistics.com/wp/wp-content/uploads/2021/12/AdobeStock_339409725-scaled-e1638913182732-768x405.jpeg 768w, https://best-biostatistics.com/wp/wp-content/uploads/2021/12/AdobeStock_339409725-scaled-e1638913182732-1536x810.jpeg 1536w, https://best-biostatistics.com/wp/wp-content/uploads/2021/12/AdobeStock_339409725-scaled-e1638913182732-2048x1080.jpeg 2048w" sizes="(max-width: 2560px) 100vw, 2560px" /></figure>



<p>まずは競合リスクについて理解しておきましょう。</p>



<p>競合リスクの定義とは以下の通り。</p>



<div class="swell-block-capbox cap_box is-style-small_ttl"><div class="cap_box_ttl"><span>競合リスクとは</span></div><div class="cap_box_content">
<p>複数のイベントが定義できる時、一方のイベントが起こると他方のイベントが観測できないこと</p>
</div></div>



<p>…わかるようでわからないような、、という感じかもしれないですね。</p>



<p>例を挙げて競合リスクを見てみましょう。</p>



<div style="height:24px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading">競合リスクの例</h3>



<p><span style="text-decoration: underline;"><strong>競合リスクの例としてよく用いられるのは「がんの増悪」と「増悪前の死亡」</strong></span>です。</p>



<p>ある研究において「がんの増悪」をイベントとして研究を実施したとします。</p>



<p>研究に組み入れられた被験者さんの中には、「がんが増悪する前に死亡」する方も出てくる可能性はありますよね。</p>



<p><span class="marker"><strong>もし「がんが増悪する前に死亡」してしまった場合、本当に見たい「がんの増悪」というイベントは未来永劫、観察できないことになります</strong></span>。</p>



<p>逆もまた然りで、「がんの増悪」というイベントが起こった場合に、「がんが増悪する前に死亡」というイベントは起こらないはず。</p>



<div style="height:24px" aria-hidden="true" class="wp-block-spacer"></div>



<p>上記の場合、<span class="marker"><strong>一方のイベントが起こると他方のイベントが観測できない、という関係が成り立つので、「がんの増悪」と「がんが増悪する前に死亡」というイベントは、互いに競合しているイベントである</strong></span>、と言えます。</p>



<p>このような場合に、競合リスクと呼んでいるのです。</p>



<div style="height:24px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">競合リスクがあったときにどうすればいい？</h2>



<figure class="wp-block-image"><img decoding="async" width="2560" height="1280" src="https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_72001980-scaled-e1636682159326.jpeg" alt="" class="wp-image-5275" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_72001980-scaled-e1636682159326.jpeg 2560w, https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_72001980-scaled-e1636682159326-300x150.jpeg 300w, https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_72001980-scaled-e1636682159326-1024x512.jpeg 1024w, https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_72001980-scaled-e1636682159326-768x384.jpeg 768w, https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_72001980-scaled-e1636682159326-1536x768.jpeg 1536w, https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_72001980-scaled-e1636682159326-2048x1024.jpeg 2048w" sizes="(max-width: 2560px) 100vw, 2560px" /></figure>



<p>では、競合リスクがあった場合にどうすればいいのでしょうか？</p>



<p>解決策としては3つ考えることができます。</p>



<ol class="wp-block-list">
<li><strong>興味あるイベント以外は打ち切りにする</strong></li>



<li><strong>興味あるイベントの定義を再考する</strong></li>



<li><strong>競合リスクを考慮した解析をする</strong></li>
</ol>



<p>それぞれ詳しくみていきましょう。</p>



<div style="height:24px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading">競合リスクがある場合の解決策1：興味あるイベント以外は打ち切りにする</h3>



<p>これはもっともシンプルな方法ですね。</p>



<p>興味あるイベントが「がんの増悪」である場合、それ以外は全て打ち切りにする、という解決策です。</p>



<p>いわゆる、通常の<a href="https://best-biostatistics.com/surviv/survival.html">生存時間解析</a>として考える、ということ。</p>



<div style="height:24px" aria-hidden="true" class="wp-block-spacer"></div>



<p>ただしこの解決策には一つだけ問題点があります。</p>



<p>それは「<a href="https://best-biostatistics.com/surviv/km.html">打ち切り</a>」の定義。</p>



<p>通常の打ち切りが意味するところは「追跡できたところまではイベントが起きていない」ということであり、これは暗に<span class="marker"><strong>「今後イベントが起こりうる可能性はある」</strong></span>ということを含んでいます。</p>



<p>例えば、試験期間が終了する時点で「がんの増悪」がみられなかった場合、試験終了まではがんの増悪はみられなかったけど、その後も追跡できるのであればイベントが観察できる可能性はあります。</p>



<p>しかし、<span class="marker"><strong>増悪前の死亡を打ち切りにした場合、今後「がんの増悪」というイベントは絶対に起こらない</strong></span>ですよね。</p>



<div style="height:24px" aria-hidden="true" class="wp-block-spacer"></div>



<p>この矛盾が問題点となります。</p>



<div style="height:24px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading">競合リスクがある場合の解決策2：興味あるイベントを再考する</h3>



<p>競合リスクがある場合の解決策2つ目は、興味あるイベントを再考することです。</p>



<p>例えば、「がんの増悪もしくは死亡のどちらか早い方」をイベントとする場合、上記の競合リスクの問題は解消されます。</p>



<p>そのため、通常の生存時間解析を適用することで問題はなくなります。</p>



<p>ただし、<span class="marker"><strong>イベントを変えるということは試験の目的も変わる</strong></span>、ということですので、慎重に考える必要があります。</p>



<div style="height:24px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading">競合リスクがある場合の解決策3：競合リスクを考慮した解析を実施する</h3>



<p>競合リスクがある場合の解決策3つ目は、競合リスクを考慮した解析を実施すること。</p>



<p>つまり、<span class="marker"><strong>「増悪前に死亡」した方は「がんの増悪」が起こらないとして扱いながら、解析をする</strong></span>ということです。</p>



<p>この解析方法が<span style="color: #ff0000;"><strong>Gray検定</strong></span>として知られています。</p>



<p>Fine &amp; Gray検定は競合リスクを考慮して、注目したいイベントの群間比較ができる解析。</p>



<p>例えば、</p>



<ul class="wp-block-list">
<li><strong>注目したいイベント：がんの増悪</strong></li>



<li><strong>競合リスク：死亡</strong></li>
</ul>



<p>だったときに、<span style="text-decoration: underline;"><strong>死亡を考慮して、がんの増悪の群間比較ができる解析</strong></span>なんです。</p>



<div style="height:24px" aria-hidden="true" class="wp-block-spacer"></div>



<p>このGray検定を実際にやってみる方法を次に紹介しますね。</p>



<div style="height:24px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">競合リスクを考慮した解析：Gray検定をEZRで実践してみる</h2>



<figure class="wp-block-image"><img decoding="async" width="2560" height="1364" src="https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_380779281-scaled.jpeg" alt="" class="wp-image-5345" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_380779281-scaled.jpeg 2560w, https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_380779281-300x160.jpeg 300w, https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_380779281-1024x546.jpeg 1024w, https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_380779281-768x409.jpeg 768w, https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_380779281-1536x818.jpeg 1536w, https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_380779281-2048x1091.jpeg 2048w" sizes="(max-width: 2560px) 100vw, 2560px" /></figure>



<p>では、競合リスクを考慮した解析であるGray検定を<a href="https://best-biostatistics.com/category/ezr">EZRで実践</a>してみましょう。</p>



<p>データは「EZRでやさしく学ぶ統計学」に付いているデモデータを用います。</p>



<p>状況としては、あるがん腫において</p>



<ul class="wp-block-list">
<li><strong>なんのイベントも起きていない：0</strong></li>



<li><strong>腫瘍の増悪：1</strong></li>



<li><strong>増悪せずに死亡：2</strong></li>
</ul>



<p>というデータになっていて、解析の目的は「増悪せずに死亡という競合リスクを考慮しながら腫瘍の増悪に対して群間比較をしたい」ということです。</p>



<p>Gray検定を実施する際に重要なのは、データの作り方。</p>



<p>以下のように、「打ち切り：0」「目的とするイベント：1」「競合するイベント：2」としてデータを作る必要があります。</p>



<figure class="wp-block-image"><img decoding="async" width="704" height="470" src="https://best-biostatistics.com/wp/wp-content/uploads/2022/01/kyougourisuku.jpg" alt="" class="wp-image-5525" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2022/01/kyougourisuku.jpg 704w, https://best-biostatistics.com/wp/wp-content/uploads/2022/01/kyougourisuku-300x200.jpg 300w" sizes="(max-width: 704px) 100vw, 704px" /></figure>



<div style="height:24px" aria-hidden="true" class="wp-block-spacer"></div>



<p>他のデータ作成は、<a href="https://best-biostatistics.com/ezr/survival-curve.html">EZRで生存時間解析を実施</a>する場合と同じで問題ありません。</p>



<div style="height:24px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading">EZRでGray検定を実施する</h3>



<p>データができたところで、実際にGray検定を実施してみましょう。</p>



<p><strong>「統計解析」＞「生存期間の解析」＞「累積発生率（競合イベントを含む）の記述と群間の比較（Gray検定）」</strong>を選択。</p>



<figure class="wp-block-image"><img decoding="async" width="705" height="315" src="https://best-biostatistics.com/wp/wp-content/uploads/2022/01/ScreenShot-2022-01-24-10.01.52.png" alt="" class="wp-image-5526" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2022/01/ScreenShot-2022-01-24-10.01.52.png 705w, https://best-biostatistics.com/wp/wp-content/uploads/2022/01/ScreenShot-2022-01-24-10.01.52-300x134.png 300w" sizes="(max-width: 705px) 100vw, 705px" /></figure>



<div style="height:24px" aria-hidden="true" class="wp-block-spacer"></div>



<p>下記のような画面になるので、</p>



<ul class="wp-block-list">
<li><strong>観察期間の変数（1つ選択）には、生存期間の列を選択</strong></li>



<li><strong>イベント（1,2,3…）、打ち切り（0）の変数（1つ選択）には、上記の注意点のように「打ち切り：0」「目的とするイベント：1」「競合するイベント：2」とした列を選択</strong></li>



<li><strong>群別する変数を選択（0〜複数選択可）には、群別したい列を選択</strong></li>
</ul>



<p>すればOKです。</p>



<figure class="wp-block-image"><img decoding="async" width="724" height="725" src="https://best-biostatistics.com/wp/wp-content/uploads/2022/01/ScreenShot-2022-01-24-10.03.31.png" alt="" class="wp-image-5527" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2022/01/ScreenShot-2022-01-24-10.03.31.png 724w, https://best-biostatistics.com/wp/wp-content/uploads/2022/01/ScreenShot-2022-01-24-10.03.31-300x300.png 300w, https://best-biostatistics.com/wp/wp-content/uploads/2022/01/ScreenShot-2022-01-24-10.03.31-150x150.png 150w" sizes="(max-width: 724px) 100vw, 724px" /></figure>



<div style="height:24px" aria-hidden="true" class="wp-block-spacer"></div>



<p>これでOKを押すと、下記のように結果が出力されます。</p>



<figure class="wp-block-image"><img decoding="async" width="553" height="358" src="https://best-biostatistics.com/wp/wp-content/uploads/2022/01/kyougourisuku_result.jpg" alt="" class="wp-image-5528" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2022/01/kyougourisuku_result.jpg 553w, https://best-biostatistics.com/wp/wp-content/uploads/2022/01/kyougourisuku_result-300x194.jpg 300w" sizes="(max-width: 553px) 100vw, 553px" /></figure>



<p>P値が2つ出ていますが、上はイベントが1（今回の場合、がんの増悪）に対する群間比較結果であり、下はイベントが2（今回の場合、増悪せずに死亡）の群間比較結果を示しています。</p>



<p>どちらの結果に注目すればいいのか？というと、<span class="marker"><strong>今回の解析の目的は「増悪せずに死亡という競合リスクを考慮しながら腫瘍の増悪に対して群間比較をしたい」ですので、イベントが1（今回の場合、がんの増悪）に対する群間比較結果を参照する必要があります</strong></span>。</p>



<div style="height:24px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">まとめ</h2>



<figure class="wp-block-image"><img decoding="async" width="2560" height="1164" src="https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_101008656-scaled-e1637541296894.jpeg" alt="" class="wp-image-5331" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_101008656-scaled-e1637541296894.jpeg 2560w, https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_101008656-scaled-e1637541296894-300x136.jpeg 300w, https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_101008656-scaled-e1637541296894-1024x466.jpeg 1024w, https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_101008656-scaled-e1637541296894-768x349.jpeg 768w, https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_101008656-scaled-e1637541296894-1536x698.jpeg 1536w, https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_101008656-scaled-e1637541296894-2048x931.jpeg 2048w" sizes="(max-width: 2560px) 100vw, 2560px" /></figure>



<p>いかがでしたか？</p>



<p>この記事では「競合リスクとGray検定とは？打ち切りとして扱うことの問題点」ということでお伝えしました。</p>



<div style="height:24px" aria-hidden="true" class="wp-block-spacer"></div>



<ul class="wp-block-list">
<li><strong>競合リスクってそもそも何？</strong></li>



<li><strong>競合リスクがある場合の解決策3つ</strong></li>



<li><strong>競合リスクを考慮した解析であるGray検定をEZRで実践してみる</strong></li>
</ul>



<div style="height:24px" aria-hidden="true" class="wp-block-spacer"></div>



<p>ということが理解できたのなら幸いです！</p>
]]></content:encoded>
					
					<wfw:commentRss>https://best-biostatistics.com/surviv/finegray-test.html/feed</wfw:commentRss>
			<slash:comments>2</slash:comments>
		
		
			</item>
		<item>
		<title>Cox比例ハザードモデルをわかりやすく解説！生存時間解析での多変量解析！</title>
		<link>https://best-biostatistics.com/surviv/cox.html</link>
					<comments>https://best-biostatistics.com/surviv/cox.html#comments</comments>
		
		<dc:creator><![CDATA[beat1115]]></dc:creator>
		<pubDate>Mon, 17 Mar 2025 02:00:15 +0000</pubDate>
				<category><![CDATA[わかりやすい生存時間解析]]></category>
		<guid isPermaLink="false">https://best-biostatistics.com/?p=5433</guid>

					<description><![CDATA[<p><img src="https://best-biostatistics.com/wp/wp-content/uploads/2021/12/統計のYoutubeアイキャッチ-11-1024x576.jpg" class="webfeedsFeaturedVisual" /></p>この記事では「Cox比例ハザードモデルをわかりやすく解説！生存時間解析での多変量解析！」ということでお伝えします。 といったことが理解できるようになりますので、ぜひ一緒に学んでいきましょう！ Cox比例ハザードモデルとは [&#8230;]]]></description>
										<content:encoded><![CDATA[<p><img src="https://best-biostatistics.com/wp/wp-content/uploads/2021/12/統計のYoutubeアイキャッチ-11-1024x576.jpg" class="webfeedsFeaturedVisual" /></p>
<p>この記事では「Cox比例ハザードモデルをわかりやすく解説！生存時間解析での多変量解析！」ということでお伝えします。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<ul class="wp-block-list">
<li><strong>Cox比例ハザードモデルは生存時間解析における多変量解析</strong></li>



<li><strong>比例ハザード性が重要</strong></li>



<li><strong>Cox比例ハザードモデルの結果はハザード比</strong></li>



<li><strong>論文でもハザード比とその95%信頼区間の推定のために使われる</strong></li>
</ul>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>といったことが理解できるようになりますので、ぜひ一緒に学んでいきましょう！</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">Cox比例ハザードモデルとは？共変量を考慮できる解析をわかりやすく解説</h2>



<figure class="wp-block-image"><img decoding="async" width="2560" height="1305" src="https://best-biostatistics.com/wp/wp-content/uploads/2021/12/AdobeStock_217038618-scaled-e1638912488282.jpeg" alt="" class="wp-image-5417" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2021/12/AdobeStock_217038618-scaled-e1638912488282.jpeg 2560w, https://best-biostatistics.com/wp/wp-content/uploads/2021/12/AdobeStock_217038618-scaled-e1638912488282-300x153.jpeg 300w, https://best-biostatistics.com/wp/wp-content/uploads/2021/12/AdobeStock_217038618-scaled-e1638912488282-1024x522.jpeg 1024w, https://best-biostatistics.com/wp/wp-content/uploads/2021/12/AdobeStock_217038618-scaled-e1638912488282-768x392.jpeg 768w, https://best-biostatistics.com/wp/wp-content/uploads/2021/12/AdobeStock_217038618-scaled-e1638912488282-1536x783.jpeg 1536w, https://best-biostatistics.com/wp/wp-content/uploads/2021/12/AdobeStock_217038618-scaled-e1638912488282-2048x1044.jpeg 2048w" sizes="(max-width: 2560px) 100vw, 2560px" /></figure>



<p>Cox比例ハザードモデルとは、<span style="text-decoration: underline;"><strong><a href="https://best-biostatistics.com/ezr/survival-curve.html">生存時間解析</a>で使われるモデル解析</strong></span>（いわゆる、<a href="https://best-biostatistics.com/correlation_regression/regression.html" data-type="post" data-id="37">回帰分析</a>）です。</p>



<p>生存時間解析とは、「あるイベントが発生するまでの時間」をアウトカムにした時に使われる解析のこと。</p>



<p>三種の神器、とまでは言わないですが、生存時間解析ではこの3つは必ず理解すべき内容です。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<ol class="wp-block-list">
<li><strong>ログランク検定</strong></li>



<li><strong>カプランマイヤー曲線</strong></li>



<li><strong>Cox比例ハザードモデル（Cox回帰）</strong></li>
</ol>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>ログランク検定とカプランマイヤー曲線はこちらの記事をご参照ください。</p>



<p>＞＞<a href="https://best-biostatistics.com/surviv/logrank.html">ログランク検定と一般化ウィルコクソン検定との違いは？</a></p>



<p>＞＞<a href="https://best-biostatistics.com/surviv/km.html">カプランマイヤー曲線について理解する！</a></p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>Cox比例ハザードモデルはモデル解析なので、共変量を考慮できる多変量解析です。</p>



<p>そのため、<span class="marker"><strong>「Cox比例ハザードモデル＝生存時間解析での多変量解析」</strong></span>とイメージしていただければOK。</p>



<p>ではちなみに、生存時間解析じゃない時のモデル解析は？と言われたらすぐに出てきますか？</p>



<ul class="wp-block-list">
<li>アウトカムが連続変数の時：<a href="https://best-biostatistics.com/correlation_regression/ancova.html">重回帰分析（共分散分析）</a></li>



<li>アウトカムがカテゴリカル変数の時：<a href="https://best-biostatistics.com/correlation_regression/logistic.html">ロジスティック回帰分析</a></li>
</ul>



<p>なので、ぜひ整理しておきましょう！</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading">Cox比例ハザードモデルでは比例ハザード性が重要</h3>



<p>Cox比例ハザードモデルを使う際に重要な知識としては、「<a href="https://best-biostatistics.com/surviv/hirei-hazard.html" data-type="post" data-id="4668">比例ハザード性</a>」があります。</p>



<p>そもそもハザードというのは、「単位時間あたりのイベント発生率」のこと。</p>



<p>その<a href="https://best-biostatistics.com/surviv/hazard-ratio.html">ハザードを群間比較しようとすると、ハザード比を使います</a>。</p>



<p>そして<a href="https://best-biostatistics.com/surviv/hirei-hazard.html">比例ハザード性というのは、「2群間のハザード比が時間に限らず常に一定であること」を指します</a>。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>以下の場合の<a href="https://best-biostatistics.com/surviv/km.html">カプランマイヤー曲線</a>は比例ハザード性が成立しています。</p>



<p>「薬を使った群が使っていない群よりも常に生存率が1.5倍だった」</p>



<figure class="wp-block-image"><img decoding="async" width="667" height="381" src="https://best-biostatistics.com/wp/wp-content/uploads/2021/06/Rplot.png" alt="" class="wp-image-4669" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2021/06/Rplot.png 667w, https://best-biostatistics.com/wp/wp-content/uploads/2021/06/Rplot-300x171.png 300w" sizes="(max-width: 667px) 100vw, 667px" /></figure>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>反対に、以下の場合は比例ハザード性が成立していません。</p>



<p>「薬を使った群と使っていない群で、最初は生存率に差がなかったが、12ヶ月後以降は差がみられるようになった」</p>



<figure class="wp-block-image"><img decoding="async" width="667" height="381" src="https://best-biostatistics.com/wp/wp-content/uploads/2021/06/Rplot01.png" alt="" class="wp-image-4670" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2021/06/Rplot01.png 667w, https://best-biostatistics.com/wp/wp-content/uploads/2021/06/Rplot01-300x171.png 300w" sizes="(max-width: 667px) 100vw, 667px" /></figure>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>この場合、最初はハザード比が1倍でしたが、12ヶ月以降あたりからハザード比がかなり大きくなっています。</p>



<p>この場合ハザード比は時間によらず一定ではないので、比例ハザード性は成立しないのです。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">Cox比例ハザードモデルの結果はハザード比を見る</h2>



<figure class="wp-block-image"><img decoding="async" width="2560" height="1708" src="https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_361019073-scaled.jpeg" alt="" class="wp-image-5229" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_361019073-scaled.jpeg 2560w, https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_361019073-300x200.jpeg 300w, https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_361019073-1024x683.jpeg 1024w, https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_361019073-768x513.jpeg 768w, https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_361019073-1536x1025.jpeg 1536w, https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_361019073-2048x1367.jpeg 2048w" sizes="(max-width: 2560px) 100vw, 2560px" /></figure>



<p>Cox比例ハザードモデルは、生存時間解析でのモデル解析（<a href="https://best-biostatistics.com/correlation_regression/tahenryou.html" data-type="post" data-id="5810">多変量解析</a>）であることがわかりました。</p>



<p>そして、Cox比例ハザードモデルを使う際には「比例ハザード性」が重要だということも理解できましたね。</p>



<p>その上で次に、Cox比例ハザードモデルを用いた解析の結果の見方を学んでいきましょう。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>早速ですが、<a href="https://best-biostatistics.com/ezr/cox-reg.html">EZRでCox比例ハザードモデルを実施した場合</a>、下記のような結果が出てきます。</p>


<div class="wp-block-image">
<figure class="aligncenter"><img decoding="async" width="566" height="75" src="https://best-biostatistics.com/wp/wp-content/uploads/2021/12/ScreenShot-2021-11-25-9.33.23.png" alt="" class="wp-image-5434" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2021/12/ScreenShot-2021-11-25-9.33.23.png 566w, https://best-biostatistics.com/wp/wp-content/uploads/2021/12/ScreenShot-2021-11-25-9.33.23-300x40.png 300w" sizes="(max-width: 566px) 100vw, 566px" /></figure>
</div>


<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<ul class="wp-block-list">
<li><a href="https://best-biostatistics.com/surviv/hazard-ratio.html">ハザード比</a></li>



<li>ハザード比の<a href="https://best-biostatistics.com/summary/95ci.html">95%信頼区間（信頼下限と信頼上限）</a></li>



<li><a href="https://best-biostatistics.com/hypo_test/p-value.html">P値</a></li>
</ul>



<p>の3つが出力されていることがわかりますね。</p>



<p>つまり、Cox比例ハザードモデルを実施した場合、メインとなる結果はハザード比である、ということです。</p>



<p>ハザード比の結果の見方は、<a href="https://best-biostatistics.com/contingency/odds_risk.html">リスク比やオッズ比との結果の見方</a>と同じです。</p>



<p>比なので、分子と分母が同じ値であれば1になります。</p>



<p>つまり、<span class="marker"><strong>ハザード比が1であれば群間差がない、1から遠ければ群間差あり</strong></span>、というような見方ですね。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">Cox比例ハザードモデルが多変量解析として論文で使われている例</h2>



<figure class="wp-block-image"><img decoding="async" width="2560" height="1356" src="https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_269254297-scaled-e1635836232575.jpeg" alt="" class="wp-image-5231" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_269254297-scaled-e1635836232575.jpeg 2560w, https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_269254297-scaled-e1635836232575-300x159.jpeg 300w, https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_269254297-scaled-e1635836232575-1024x542.jpeg 1024w, https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_269254297-scaled-e1635836232575-768x407.jpeg 768w, https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_269254297-scaled-e1635836232575-1536x814.jpeg 1536w, https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_269254297-scaled-e1635836232575-2048x1085.jpeg 2048w" sizes="(max-width: 2560px) 100vw, 2560px" /></figure>



<p>では最後に、論文でCox比例ハザードモデルが使われている例をみていきましょう。</p>



<p>生存時間解析では、「ログランク検定」「カプランマイヤー曲線」「Cox比例ハザードモデル」の3つは必ず理解しておく必要がある通り、生存時間解析の論文ではCox比例ハザードモデルは大抵使っています。</p>



<p>例えば、こちらの論文。</p>



<p>Methodを見ると以下のような記載があります。</p>


<div class="wp-block-image">
<figure class="aligncenter"><img decoding="async" width="400" height="103" src="https://best-biostatistics.com/wp/wp-content/uploads/2021/12/202102nejmoa1915922_pdf-1.jpg" alt="" class="wp-image-5435" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2021/12/202102nejmoa1915922_pdf-1.jpg 400w, https://best-biostatistics.com/wp/wp-content/uploads/2021/12/202102nejmoa1915922_pdf-1-300x77.jpg 300w" sizes="(max-width: 400px) 100vw, 400px" /></figure>
</div>


<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p><span class="marker"><strong>「ハザード比と95%信頼区間を推定するためにCox比例ハザードモデルを使った」</strong></span>とあるので、まさに今までみてきたことですね。</p>



<p>そして結果の表としては、以下の通りになっています。</p>


<div class="wp-block-image">
<figure class="aligncenter"><img decoding="async" width="947" height="360" src="https://best-biostatistics.com/wp/wp-content/uploads/2021/12/202102nejmoa1915922_pdf2.jpg" alt="" class="wp-image-5436" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2021/12/202102nejmoa1915922_pdf2.jpg 947w, https://best-biostatistics.com/wp/wp-content/uploads/2021/12/202102nejmoa1915922_pdf2-300x114.jpg 300w, https://best-biostatistics.com/wp/wp-content/uploads/2021/12/202102nejmoa1915922_pdf2-768x292.jpg 768w" sizes="(max-width: 947px) 100vw, 947px" /></figure>
</div>


<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<ul class="wp-block-list">
<li>ハザード比</li>



<li>ハザード比の95%信頼区間</li>



<li>P値</li>
</ul>



<p>と、<a href="https://best-biostatistics.com/ezr/cox-reg.html">EZRでCox比例ハザードモデルを実施した場合</a>と同じ結果が論文に記載されています。</p>



<p>Cox比例ハザードモデルを使った論文では、これぐらいの結果を記載すればOKということですね。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">まとめ</h2>



<figure class="wp-block-image"><img decoding="async" width="2560" height="1164" src="https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_101008656-scaled-e1637541296894.jpeg" alt="" class="wp-image-5331" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_101008656-scaled-e1637541296894.jpeg 2560w, https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_101008656-scaled-e1637541296894-300x136.jpeg 300w, https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_101008656-scaled-e1637541296894-1024x466.jpeg 1024w, https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_101008656-scaled-e1637541296894-768x349.jpeg 768w, https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_101008656-scaled-e1637541296894-1536x698.jpeg 1536w, https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_101008656-scaled-e1637541296894-2048x931.jpeg 2048w" sizes="(max-width: 2560px) 100vw, 2560px" /></figure>



<p>いかがでしたか？</p>



<p>この記事では「Cox比例ハザードモデルをわかりやすく解説！生存時間解析での多変量解析！」ということでお伝えしました。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<ul class="wp-block-list">
<li><strong>Cox比例ハザードモデルは生存時間解析における多変量解析</strong></li>



<li><strong>比例ハザード性が重要</strong></li>



<li><strong>Cox比例ハザードモデルの結果はハザード比</strong></li>



<li><strong>論文でもハザード比とその95%信頼区間の推定のために使われる</strong></li>
</ul>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>といったことが理解できたのなら幸いです！</p>



<p>Cox比例ハザードモデルの特殊バージョンに、<a href="https://best-biostatistics.com/surviv/time-dependent-cox.html">時間依存性の共変量を考慮したCox比例ハザードモデルもありますので、必要でしたらこちらのページもご覧ください</a>。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>こちらの内容は動画でもお伝えしておりますので、併せてご確認くださいませ。</p>



<figure class="wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio"><div class="wp-block-embed__wrapper">
<iframe title="Cox比例ハザードモデルとはどんな解析？共変量を考慮できる多変量解析" width="500" height="281" src="https://www.youtube.com/embed/GDnPzX2BXes?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe>
</div></figure>




]]></content:encoded>
					
					<wfw:commentRss>https://best-biostatistics.com/surviv/cox.html/feed</wfw:commentRss>
			<slash:comments>2</slash:comments>
		
		
			</item>
		<item>
		<title>ログランク検定と一般化ウィルコクソン検定とは？p値やカプランマイヤー曲線の解釈</title>
		<link>https://best-biostatistics.com/surviv/logrank.html</link>
					<comments>https://best-biostatistics.com/surviv/logrank.html#respond</comments>
		
		<dc:creator><![CDATA[beat1115]]></dc:creator>
		<pubDate>Tue, 11 Mar 2025 05:00:15 +0000</pubDate>
				<category><![CDATA[わかりやすい生存時間解析]]></category>
		<guid isPermaLink="false">https://best-biostatistics.com/?p=1128</guid>

					<description><![CDATA[<p><img src="https://best-biostatistics.com/wp/wp-content/uploads/2019/03/screenshot-2019-06-04-11.51.33.png" class="webfeedsFeaturedVisual" /></p>生存時間解析で出てくる代表的な２種類のノンパラメトリック検定が、ログランク検定（Log-rank test）と一般化ウィルコクソン検定（Generalized Wilcoxon test）です。 この記事では、その2つの [&#8230;]]]></description>
										<content:encoded><![CDATA[<p><img src="https://best-biostatistics.com/wp/wp-content/uploads/2019/03/screenshot-2019-06-04-11.51.33.png" class="webfeedsFeaturedVisual" /></p>
<p>生存時間解析で出てくる代表的な２種類のノンパラメトリック検定が、ログランク検定（Log-rank test）と一般化ウィルコクソン検定（Generalized Wilcoxon test）です。</p>



<p>この記事では、その2つの検定について解説します。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>この記事を読めば、以下のことがわかるように！</p>



<ul class="wp-block-list">
<li><strong>ログランク検定の帰無仮説・対立仮説</strong></li>



<li><strong>ログランク検定でやっていることの概要</strong></li>



<li><strong>一般化ウィルコクソン検定の概要</strong></li>



<li><strong>ログランク検定と一般化ウィルコクソン検定との違い</strong></li>



<li><strong>ログランク検定と一般化ウィルコクソン検定の、それぞれ得意とする場面</strong></li>
</ul>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>それではいってみましょう！</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">ログランク検定はどんなデータを対象とした検定か？カプランマイヤーとセットで解析する</h2>


<div class="wp-block-image">
<figure class="aligncenter"><img decoding="async" width="640" height="340" src="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/2ae4ec48eb55ae189560e8bb40caa89f_s-e1577089193118.jpg" alt="ログランク検定はどんなデータを対象とした検定か？カプランマイヤーとセットで解析する" class="wp-image-2529" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/2ae4ec48eb55ae189560e8bb40caa89f_s-e1577089193118.jpg 640w, https://best-biostatistics.com/wp/wp-content/uploads/2019/10/2ae4ec48eb55ae189560e8bb40caa89f_s-e1577089193118-300x159.jpg 300w" sizes="(max-width: 640px) 100vw, 640px" /></figure>
</div>


<p>まずは、ログランク検定が対象とするデータです。</p>



<p><a href="https://best-biostatistics.com/stat-test/t-test.html" target="_blank" rel="noopener noreferrer">T検定は連続量を対象とした検定</a>でしたよね。</p>



<p><a href="https://best-biostatistics.com/contingency/chi-square.html" target="_blank" rel="noopener noreferrer">カイ二乗検定はカテゴリカルデータを対象とした検定</a>でした。</p>



<p>では、ログランク検定はどうでしょうか？</p>



<p>結論から言うと、<strong><span class="marker">ログランク検定は生存時間を対象とした検定</span></strong>です。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<figure class="wp-block-table"><table class="has-fixed-layout"><tbody><tr><td></td><td>T検定</td><td>カイ二乗検定</td><td><span style="color: #ff0000;">ログランク検定</span></td></tr><tr><td>対象データ</td><td>連続量</td><td>カテゴリカルデータ</td><td><span style="color: #ff0000;">生存時間</span></td></tr></tbody></table></figure>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>ログランク検定は<a href="https://best-biostatistics.com/surviv/survival.html" target="_blank" rel="noopener noreferrer">生存時間解析で用いる</a>検定手法です。</p>



<p><a href="https://best-biostatistics.com/surviv/km.html" target="_blank" rel="noopener noreferrer">生存時間解析で可視化する方法は、カプランマイヤー曲線</a>でしたね。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading">カプランマイヤー曲線のP値はログランク検定のP値であることがほとんど</h3>



<p>ログランク検定は、カプランマイヤー曲線とセットで出てくることが多いです。</p>



<p>カプランマイヤー曲線に<a href="https://best-biostatistics.com/hypo_test/p-value.html">p値</a>が記載されていたら、それはほぼログランク検定のp値であると認識しておいてよいでしょう。</p>



<p>例えば、下記の論文ではMethodに「<strong><span style="text-decoration: underline;">Kaplan-Meier curves</span></strong> were calculated for time-to-event end points, with differences between arms tested at the overall 5% significance level <strong><span style="text-decoration: underline;">by log-rank test</span></strong>.」とあり、ログランク検定のp値が記載されていることがわかります。</p>



<figure class="wp-block-image size-full is-resized"><img decoding="async" width="922" height="622" src="https://best-biostatistics.com/wp/wp-content/uploads/2024/03/aaaaaa.png" alt="" class="wp-image-7987" style="width:852px;height:auto" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2024/03/aaaaaa.png 922w, https://best-biostatistics.com/wp/wp-content/uploads/2024/03/aaaaaa-300x202.png 300w, https://best-biostatistics.com/wp/wp-content/uploads/2024/03/aaaaaa-768x518.png 768w" sizes="(max-width: 922px) 100vw, 922px" /></figure>



<p>引用：Trastuzumab Plus Anastrozole Versus Anastrozole Alone for the Treatment of Postmenopausal Women With Human Epidermal Growth Factor Receptor 2–Positive, Hormone Receptor–Positive Metastatic Breast Cancer: Results From the Randomized Phase III TAnDEM Study</p>



<p class="has-text-align-right"><a href="DOI: 10.1200/JCO.2008.20.6847">DOI: 10.1200/JCO.2008.20.6847</a></p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">ログランク検定の帰無仮説と対立仮説は？</h2>


<div class="wp-block-image">
<figure class="aligncenter"><img decoding="async" width="640" height="345" src="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/987eca87017b5f2fa265f89558d4724a_s-e1577496841202.jpg" alt="ログランク検定の帰無仮説と対立仮説は？" class="wp-image-2530" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/987eca87017b5f2fa265f89558d4724a_s-e1577496841202.jpg 640w, https://best-biostatistics.com/wp/wp-content/uploads/2019/10/987eca87017b5f2fa265f89558d4724a_s-e1577496841202-300x162.jpg 300w" sizes="(max-width: 640px) 100vw, 640px" /></figure>
</div>


<p>ログランク検定は統計的検定の１つであるため、当然ながら<a href="https://best-biostatistics.com/hypo_test/hypo.html" target="_blank" rel="noopener noreferrer">帰無仮説と対立仮説があります</a>。</p>



<p>まずはそれを理解しておきましょう。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>ログランク検定の帰無仮説と対立仮説はこちらです。（２群の場合）</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<div class="boldBox">
<ul>
<li><span style="font-size: 14pt;"><strong>帰無仮説：全ての時点で、２群の生存率は同じ</strong></span></li>
<li><span style="font-size: 14pt;"><strong>対立仮説：ある任意の時点で、２群の生存率は異なる</strong></span></li>
</ul>
</div>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>つまり、<strong>２群の生存率が同じかどうかを検定している</strong>ということ。</p>



<p>ログランク検定の<a href="https://best-biostatistics.com/hypo_test/significant.html" target="_blank" rel="noopener noreferrer">P値が、事前に決めておいた有意水準よりも小さければ、生存率が２群で異なる</a>という結論を導くことができます。</p>



<p>この解釈の仕方は、他の検定でも同じですね。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">ログランク検定はノンパラメトリック検定</h2>


<div class="wp-block-image">
<figure class="aligncenter"><img decoding="async" width="640" height="350" src="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/f3ff2b38f21bcd8da977db80ed2a0e7e_s-e1577089044626.jpg" alt="ログランク検定はノンパラメトリック検定" class="wp-image-2531" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2019/10/f3ff2b38f21bcd8da977db80ed2a0e7e_s-e1577089044626.jpg 640w, https://best-biostatistics.com/wp/wp-content/uploads/2019/10/f3ff2b38f21bcd8da977db80ed2a0e7e_s-e1577089044626-300x164.jpg 300w" sizes="(max-width: 640px) 100vw, 640px" /></figure>
</div>


<p>ログランク検定は、<a href="https://best-biostatistics.com/hypo_test/para.html" target="_blank" rel="noopener noreferrer">ノンパラメトリック検定の１つ</a>です。</p>



<p>ということは、<strong>検定をする際にデータの分布を仮定しない</strong>検定だということですね。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>一方、生存時間解析で良く出てくる<a href="https://best-biostatistics.com/surviv/cox.html" data-type="post" data-id="5433">Cox比例ハザードモデル</a>は、セミパラメトリックな方法です。</p>



<p>その名の通り、<strong>各時点のハザード比が一定であることを仮定</strong>しているためです。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">ログランク検定でやっていること</h2>



<p>では、<strong>実際にログランク検定でやっていることは何だろう？</strong>と思いませんか。</p>



<p>それを解説していきます。</p>



<p>ログランク検定でやっていることを一言で表すと、これです。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<div class="ep-box es-BpaperRight es-grid bgc-VPsky"><span style="font-size: 14pt;"><strong>イベントが起こるごとに２×２分割表を作成する</strong></span></div>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>・・・これだけじゃわからないですよね。</p>



<p>なので、実際に例を見ていきましょう。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading">例を見ながらログランク検定の概要を知る</h3>



<p>例えば、以下のようなデータがあったとします。</p>



<p>今回の例では、死亡がイベントです。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<figure class="wp-block-table"><table class="has-fixed-layout"><tbody><tr><td>群</td><td>生存または打ち切りの時間（ヶ月）</td><td>死亡（１）なのか打ち切り（０）なのかの違い</td></tr><tr><td>実薬群</td><td>5</td><td>0</td></tr><tr><td>実薬群</td><td>7</td><td>0</td></tr><tr><td>実薬群</td><td>8</td><td>1</td></tr><tr><td>実薬群</td><td>12</td><td>0</td></tr><tr><td>プラセボ群</td><td>2</td><td>0</td></tr><tr><td>プラセボ群</td><td>3</td><td>1</td></tr><tr><td>プラセボ群</td><td>4</td><td>1</td></tr><tr><td>プラセボ群</td><td>10</td><td>0</td></tr></tbody></table></figure>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>このデータで、イベント（死亡）は３回起こっていますよね。</p>



<ol class="wp-block-list">
<li><span style="text-decoration: underline;"><strong>実薬群の８ヶ月目</strong></span></li>



<li><span style="text-decoration: underline;"><strong>プラセボ群の３ヶ月目</strong></span></li>



<li><span style="text-decoration: underline;"><strong>プラセボ群の４ヶ月目</strong></span></li>
</ol>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>この３つです。</p>



<p>この３つの時点で<a href="https://best-biostatistics.com/contingency/contingency-kiso.html" target="_blank" rel="noopener noreferrer">２×２分割表</a>を作成します。</p>



<p>つまり、以下のような分割表が作成できます。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>3ヶ月時点の分割表</p>



<figure class="wp-block-table"><table class="has-fixed-layout"><tbody><tr><td>3ヶ月目</td><td>死亡数</td><td>生存数</td><td>合計</td></tr><tr><td>実薬群</td><td>0</td><td>4</td><td>4</td></tr><tr><td>プラセボ群</td><td>1</td><td>2</td><td>3</td></tr><tr><td>合計</td><td>1</td><td>6</td><td>7</td></tr></tbody></table></figure>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>4ヶ月時点の分割表</p>



<figure class="wp-block-table"><table class="has-fixed-layout"><tbody><tr><td>4ヶ月目</td><td>死亡数</td><td>生存数</td><td>合計</td></tr><tr><td>実薬群</td><td>0</td><td>4</td><td>4</td></tr><tr><td>プラセボ群</td><td>1</td><td>1</td><td>2</td></tr><tr><td>合計</td><td>1</td><td>5</td><td>6</td></tr></tbody></table></figure>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>8ヶ月時点の分割表</p>



<figure class="wp-block-table"><table class="has-fixed-layout"><tbody><tr><td>8ヶ月目</td><td>死亡数</td><td>生存数</td><td>合計</td></tr><tr><td>実薬群</td><td>1</td><td>1</td><td>2</td></tr><tr><td>プラセボ群</td><td>0</td><td>1</td><td>1</td></tr><tr><td>合計</td><td>1</td><td>2</td><td>3</td></tr></tbody></table></figure>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>ここで注意していただきたいのが、分割表にある合計の数値は「その時点で追跡できている数」になるということ。</p>



<p>データでは実薬群が４例、プラセボ群も４例の計８例です。</p>



<p>ですが、表中の３ヶ月時点でのデータを見れば分かる通り、プラセボ群の合計が３例で、トータルの例数は７例です。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p><strong>「あれ？プラセボ群は４例でトータル８例じゃなかった？」</strong></p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>と思いますよね。</p>



<p>なぜプラセボ群の１例がいなくなったかというと、<strong>２ヶ月時点で<a href="https://best-biostatistics.com/surviv/km.html">打ち切り症例</a>が１例いるから。</strong></p>



<p>初めてイベントが起こる３ヶ月時点より早い時点（２ヶ月目）で、プラセボ群の１例は追跡不能になったため、イベント発生時の分割表からは除かれているんです。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>以上が、ログランク検定でやっていることの概要です。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>







<h3 class="wp-block-heading">ログランク検定の検定統計量はカイ二乗統計量の発展</h3>



<p>ログランク検定でやっていることは、イベントが発生した時点で２×２分割表を作成することだと理解しました。</p>



<p>であれば、検定統計量はどうなるでしょうか？</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>分割表を作成すると、算出できる統計量がありますよね。</p>



<p>そう、<a href="https://best-biostatistics.com/contingency/chi-square.html" target="_blank" rel="noopener noreferrer">カイ二乗統計量</a>です。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>そのため、ログランク検定でやっていることをまとめると以下の通りになります。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<div class="ep-box es-BpaperRight es-grid bgc-VPsky"><span class="marker"><strong><span style="font-size: 14pt;">イベントが起こるごとに２×２分割表を作成し、カイ二乗統計量を算出してP値を出力している</span></strong></span></div>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">一般化ウィルコクソンについて。ログランク検定との違いは？</h2>



<p>一般化ウィルコクソン検定は、ログランク検定と同じ、生存時間を扱う解析手法です。</p>



<p>では、ログランク検定と一般化ウィルコクソン検定では何が違うのでしょうか。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p><strong>実は、ほとんど違いがありません</strong>。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>帰無仮説と対立仮説は、ログランク検定と同じで以下の通りです。（２群の場合）</p>



<ul class="wp-block-list">
<li><strong>帰無仮説：全ての時点で、２群の生存率は同じ</strong></li>



<li><strong>対立仮説：ある任意の時点で、２群の生存率は異なる</strong></li>
</ul>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>また、一般化ウィルコクソン検定もログランク検定も同様にノンパラメトリック検定です。</p>



<p>さらに、一般化ウィルコクソン検定でやっていることも<span style="color: #ff0000; font-size: 14pt;"><strong>「イベントが起こるごとに２×２分割表を作成し、カイ二乗統計量を算出してP値を出力している」</strong></span>ということなので、ログランク検定と同じですね。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>唯一の違いがこれです。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<div class="ep-box es-BpaperRight es-grid bgc-VPsky"><span style="font-size: 14pt;"><strong>ログランク検定と一般化ウィルコクソン検定では、カイ二乗統計量の計算の仕方が違う</strong></span></div>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading">一般化ウィルコクソン検定の考え方</h3>



<p>一般化ウィルコクソン検定で重要となるたった１つの考え方があります。</p>



<p>それがこちら。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<div class="ep-box es-BpaperRight es-grid bgc-VPsky"><span style="font-size: 14pt;"><strong>試験の最初は例数が多いため信頼性の高いデータになる。しかし、後ろになると例数が減るために信頼性の低いデータになる</strong></span></div>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>例えば、100例生存していた中から20例死亡すると、「だいたい２割」と自信を持って言えそうですよね。</p>



<p>しかし、5例中1例死亡しても「だいたい２割」と本当に言えるのか？ということが疑問になります。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>そのため例数の多く残っている、前の方の時点のデータを重要視するのです。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>一方のログランク検定は、どの時点のデータでも平等に扱っています。</p>



<p>よって、ログランク検定と一般化ウィルコクソン検定の違いをまとめると以下の通りです。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<div class="ep-box es-Bicon icon-tag bgc-VPorange"><span style="font-size: 14pt;"><strong>ログランク検定ではどの時点のデータも平等に扱う。一方で一般化ウィルコクソン検定では、例数の多く残っている前の方の時点のデータを重要視して扱う</strong></span></div>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">ログランク検定と一般化ウィルコクソン検定の使い分け</h2>



<p>では次に知りたいことは、そのログランク検定と一般化ウィルコクソン検定の違いによって、どのような使い分けになるのか？ということです。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>結論は以下の通り。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<ul class="wp-block-list">
<li><strong>「時間がたてばたつほど、群間差が開いてくる」タイプのデータに対しては、一般化ウィルコクソン検定よりもログランク検定の方が、有意差がつきやすくなる。</strong></li>



<li><strong>一方、「結局ほぼ全員が死亡するのだけど、生存時間が延びる」タイプのデータでは、一般化ウィルコクソン検定の方が、差がつきやすくなる。</strong></li>
</ul>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>イメージとしては、以下の通りです。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<figure class="wp-block-image"><img decoding="async" width="375" height="352" src="https://best-biostatistics.com/wp/wp-content/uploads/2019/03/スクリーンショット-2019-03-20-20.42.50.png" alt="ログランク検定と一般化ウィルコクソン検定の使い分け" class="wp-image-1143" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2019/03/スクリーンショット-2019-03-20-20.42.50.png 375w, https://best-biostatistics.com/wp/wp-content/uploads/2019/03/スクリーンショット-2019-03-20-20.42.50-300x282.png 300w" sizes="(max-width: 375px) 100vw, 375px" /></figure>



<p>上記のグラフのように、時間がたつほど曲線に差が出るのであれば、ログランク検定で有意差がつきやすいです。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<figure class="wp-block-image"><img decoding="async" width="325" height="353" src="https://best-biostatistics.com/wp/wp-content/uploads/2019/03/スクリーンショット-2019-03-20-20.43.02.png" alt="ログランク検定と一般化ウィルコクソン検定の使い分け" class="wp-image-1144" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2019/03/スクリーンショット-2019-03-20-20.43.02.png 325w, https://best-biostatistics.com/wp/wp-content/uploads/2019/03/スクリーンショット-2019-03-20-20.43.02-276x300.png 276w" sizes="(max-width: 325px) 100vw, 325px" /></figure>



<p>上記のグラフのように、最初は差がつくけど最終的には同じになる場合、一般化ウィルコクソン検定で有意差がつきやすいです。</p>



<p>ただ、多くの論文を見ていると、<span style="text-decoration: underline;"><strong>一般化ウィルコクソン検定を実施している論文はほぼ皆無</strong></span>です。</p>



<p>そのため、<span class="marker"><strong>ログランク検定を用いていれば問題ありません</strong></span>。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">ログランク検定をEZRで実践する</h2>



<p><a href="https://best-biostatistics.com/ezr/survival-curve.html" target="_blank" rel="noopener noreferrer">ログランク検定をEZRで実践する方法を、別記事で解説しています</a>。</p>



<p>EZRとは無料の統計ソフトであるRを、SPSSやJMPなどのようにマウス操作だけで解析を行うことができるソフトです。</p>



<p>EZRもRと同様に完全に無料であるため、統計解析を実施する誰もが実践できるソフトになっています。</p>



<p>2019年5月の時点で英文論文での引用回数が2400回を超えているとのことで、論文投稿するための解析ソフトとしても申し分ありません。</p>



<p>これを機に、EZRで統計解析を実施してみてはいかがでしょうか？</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>＞＞<a href="https://best-biostatistics.com/ezr/survival-curve.html" target="_blank" rel="noopener noreferrer">EZRでログランク検定を実践する</a>。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">ログランク検定に関するまとめ</h2>



<ul class="wp-block-list">
<li>ログランク検定とは、生存時間を対象としたノンパラメトリック検定である。</li>



<li>ログランク検定でやっていることは、イベントが起こるごとに２×２分割表を作成し、カイ二乗統計量を算出してP値を出力する、ということ。</li>



<li>一般化ウィルコクソン検定は、ログランク検定と同様に生存時間を解析する手法</li>



<li>ログランク検定では、どの時点のデータも平等に扱う。一方で一般化ウィルコクソン検定では、例数の多く残っている前の方の時点のデータを重要視して扱う</li>



<li>ログランク検定は時間がたてばたつほど、群間差が開いてくる」タイプのデータに対して有意差がつきやすくなり、一般化ウィルコクソン検定は「結局ほぼ全員が死亡するのだけど、生存時間が延びる」タイプのデータで有意差がつきやすくなる。</li>
</ul>
]]></content:encoded>
					
					<wfw:commentRss>https://best-biostatistics.com/surviv/logrank.html/feed</wfw:commentRss>
			<slash:comments>0</slash:comments>
		
		
			</item>
		<item>
		<title>生存時間解析をわかりやすく解説！カプランマイヤー曲線や打ち切りとは？</title>
		<link>https://best-biostatistics.com/surviv/survival.html</link>
					<comments>https://best-biostatistics.com/surviv/survival.html#comments</comments>
		
		<dc:creator><![CDATA[beat1115]]></dc:creator>
		<pubDate>Mon, 10 Mar 2025 00:00:30 +0000</pubDate>
				<category><![CDATA[わかりやすい生存時間解析]]></category>
		<category><![CDATA[イベント]]></category>
		<category><![CDATA[カプランマイヤー曲線]]></category>
		<category><![CDATA[打ち切り]]></category>
		<guid isPermaLink="false">http://best-biostatistics.com/wp/2018/08/27/survival/</guid>

					<description><![CDATA[<p><img src="https://best-biostatistics.com/wp/wp-content/uploads/2022/10/統計のYoutubeアイキャッチ-24-1024x576.jpg" class="webfeedsFeaturedVisual" /></p>生物統計では有名な生存時間解析。
その特徴とカプランマイヤー曲線の特徴に関して、分かりやすく説明しています。
]]></description>
										<content:encoded><![CDATA[<p><img src="https://best-biostatistics.com/wp/wp-content/uploads/2022/10/統計のYoutubeアイキャッチ-24-1024x576.jpg" class="webfeedsFeaturedVisual" /></p>
<p>臨床研究における統計手法としては、とてもメジャーになった生存時間解析。</p>



<p>カプランマイヤー曲線も有名で、生存時間解析とセットで出てきますよね。</p>



<p>がん領域で使われることの多い解析手法のため、「生存時間」という名称がとてもしっくりきます。</p>



<p>ですが実は、生存時間解析は「生存/死亡」データ以外にも適用可能。</p>



<p>このページでは、そんな生存時間解析やカプランマイヤー曲線をわかりやすく解説します。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">生存時間解析とは？「イベント」と「時間」を解析するユニークな解析</h2>



<figure class="wp-block-image"><img decoding="async" width="1280" height="464" src="https://best-biostatistics.com/wp/wp-content/uploads/2021/05/hand-1218086_1280-e1621575517709.png" alt="" class="wp-image-4566" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2021/05/hand-1218086_1280-e1621575517709.png 1280w, https://best-biostatistics.com/wp/wp-content/uploads/2021/05/hand-1218086_1280-e1621575517709-300x109.png 300w, https://best-biostatistics.com/wp/wp-content/uploads/2021/05/hand-1218086_1280-e1621575517709-1024x371.png 1024w, https://best-biostatistics.com/wp/wp-content/uploads/2021/05/hand-1218086_1280-e1621575517709-768x278.png 768w" sizes="(max-width: 1280px) 100vw, 1280px" /></figure>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>生存時間解析を一言でいうと、その名の通り<strong><span class="ylw">「時間」を解析する方法</span></strong>です。</p>



<p>時間は、「１時間」とか「７５日」とかですよね。</p>



<p>普通に考えると、<strong>連続量として扱って解析しても良さそう</strong>です。</p>



<p>連続量として扱えば、<a href="https://best-biostatistics.com/stat-test/t-test.html">T検定</a>や<a href="https://best-biostatistics.com/stat-test/w-test.html">ウィルコクソンの順位和検定</a>を使えばいいですよね。</p>



<p>ではなぜわざわざ生存時間解析、というものを使うのでしょうか。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading">生存時間解析で重要なイベントという概念</h3>



<p>なぜわざわざ生存時間解析を使う必要があるのか。</p>



<p>それを理解するためには、「<span class="ylw">イベント</span>」という概念を理解する必要があります。</p>



<p>イベントの定義は「<strong><span style="text-decoration: underline;">その研究内で１度だけ起こる事象</span></strong>」です。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>例えば、「死亡」はイベントの定義に当てはまります。</p>



<p>２回以上死亡する人はいないからですね。</p>



<p>その他にも、「初回骨折」も１度だけ起こる事象です。</p>



<p>骨折は複数回起こる可能性がありますが、「初回」に限定すると１度しか起こりません。</p>



<p>そうなると「初回」をつければ何でもイベントになるか、と思いますよね。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>・・・正解です！！</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>初回は、絶対１度しか起こりません。</p>



<p>なので、<strong>全部に「初回」をつけてしまえば、それはイベントになります</strong>。</p>



<ul class="wp-block-list">
<li><strong>初回の有害事象発現</strong></li>



<li><strong>初回の骨折</strong></li>



<li><strong>初回の感染症への観戦</strong></li>



<li><strong>etc&#8230;</strong></li>
</ul>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>では話を戻して、<strong>なぜ生存時間解析でイベントの概念が必要になるのか</strong>。</p>



<p>それは、<span style="color: #ff0000; font-size: 14pt;"><strong>生存時間解析が「イベントまでの時間」を扱う解析手法</strong></span>だからです。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h3 class="wp-block-heading">生存時間解析でもう一つ重要な概念である打ち切り</h3>



<p>生存時間解析で、イベントという概念が重要だと学びました。</p>



<p>もう一つだけ、重要な概念があります。</p>



<p>それは、「<strong><span style="text-decoration: underline;"><span class="ylw">打ち切り</span></span></strong>」です。</p>



<p>打ち切りは教科書的に様々な定義がされていますが、ここでは誤解を恐れずに簡単に定義します。</p>



<p>打ち切りの定義は「<span style="color: #ff0000; font-size: 14pt;"><strong><span style="text-decoration: underline;"><span class="ylw">イベントが起こっていないこと</span></span></strong></span>」です。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>例を使いましょう。</p>



<p>例えば、イベントとして死亡を定義し、死亡までの時間を解析したいとします。</p>



<p>そして、試験の期間は２年間とします。</p>



<p>１０人を集めて試験をした時、２年後までに死亡してしまう方が３人いたとします。</p>



<p>そして５人が生存したまま試験期間を終了し、残りの２名が途中で何らかの理由で試験を辞めてしまいました。</p>



<p>その時に、それぞれ以下の３つのカテゴリに１０人を分けることができます。</p>



<ul class="wp-block-list">
<li><strong><span style="font-size: 10pt;"><span class="swl-fz u-fz-l">死亡した人</span></span></strong></li>



<li><strong><span style="font-size: 10pt;"><span class="swl-fz u-fz-l">死亡しておらず試験期間を完了した人</span></span></strong></li>



<li><strong><span style="font-size: 10pt;"><span class="swl-fz u-fz-l">死亡しておらず試験期間完了前に辞めた人</span></span></strong></li>
</ul>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<figure class="wp-block-image"><img decoding="async" width="824" height="539" src="https://best-biostatistics.com/wp/wp-content/uploads/2018/08/生存.png" alt="" class="wp-image-356" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2018/08/生存.png 824w, https://best-biostatistics.com/wp/wp-content/uploads/2018/08/生存-300x196.png 300w, https://best-biostatistics.com/wp/wp-content/uploads/2018/08/生存-768x502.png 768w" sizes="(max-width: 824px) 100vw, 824px" /></figure>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>この時、<strong>「死亡した人」はイベントを起こしたとして解析できます</strong>。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>では、他の２つのカテゴリに入る人のデータは、どう扱えばよいでしょうか？</p>



<p>つまり、<span style="font-size: 16px;">「<strong>死亡しておらず試験期間を完了した人」と「死亡しておらず試験期間完了前に辞めた人」は、どう扱うべきでしょうか？</strong></span></p>



<p>データが得られた最後の時点を死亡として扱いますか？</p>



<p>でも死亡として扱うと、実際には生存しているので、現実とは異なるデータになってしまいます。</p>



<p>生存しているのに死亡していると扱ってしまうと、<a href="https://best-biostatistics.com/design/bias.html" target="_blank" rel="noopener noreferrer">結果に偏り（バイアス）が出てしまいます</a>。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>そのため生存時間解析では、この<span style="color: #ff0000; font-size: 12pt;"><strong>「死亡しておらず試験期間を完了した人」と「死亡しておらず試験期間完了前に辞めた人」を「打ち切りデータ」として扱います</strong></span>。</p>



<p>イベントは起きていない。</p>



<p>でも、それ以降のデータはない。</p>



<p>そのため<strong>「<span class="ylw">得られているデータの時点まではイベントが起きていないデータ</span>」</strong>として扱うことができます。</p>



<p>これを「打ち切りデータ」と呼んでいるのです。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">生存時間解析は、打ち切りを考慮しながらイベントまでの時間を解析できる方法</h2>



<p>以上の話をまとめると、生存時間解析はこのように言い換えることができます。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<div class="pointBox ep-box es-Bicon icon-tag bgc-VPorange">
<p><span style="font-size: 14pt;"><strong>生存時間解析：打ち切りを考慮しながらイベントまでの時間を解析できる方法</strong></span></p>
</div>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>例えば、全てのデータがイベントを起こしていて、打ち切りのデータが存在しない時。</p>



<p>この場合には、イベントまでの時間を連続量として扱い、T検定やウィルコクソンの順位和検定をすることも許されます。</p>



<p>だって、打ち切りがないので、別に難しい生存時間解析をしなくていいですよね。</p>



<p>なので生存時間解析では、「イベント」と「打ち切り」の両方のデータがある場合にとても便利な方法と言えます。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">生存時間解析を可視化する：カプランマイヤー曲線</h2>



<figure class="wp-block-image"><img decoding="async" width="458" height="411" src="https://best-biostatistics.com/wp/wp-content/uploads/2018/08/km.png" alt="" class="wp-image-159" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2018/08/km.png 458w, https://best-biostatistics.com/wp/wp-content/uploads/2018/08/km-300x269.png 300w" sizes="(max-width: 458px) 100vw, 458px" /></figure>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>この生存時間解析に関して、可視化（グラフ）できる方法があります。</p>



<p>それは、<a href="https://best-biostatistics.com/surviv/km.html" target="_blank" rel="noopener noreferrer">カプランマイヤー曲線を描くことです。</a></p>



<p>上記のようなグラフですね。</p>



<p>カプランマイヤー曲線は、データを読み取るのにかなり有意義なグラフです。</p>



<p>そして、カプランマイヤー曲線を正確に読み取るには、先ほどの「イベント」と「打ち切り」を正確に理解する必要があります。</p>



<p>カプランマイヤー曲線の詳細はこちらをご覧ください。</p>



<p>＞＞<a href="https://best-biostatistics.com/surviv/km.html" data-type="post" data-id="57">カプランマイヤー曲線の書き方は？</a></p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">生存時間をEZRで実践する</h2>



<p><a href="https://best-biostatistics.com/ezr/survival-curve.html" target="_blank" rel="noopener noreferrer">生存時間解析をEZRで実践する方法を、別記事で解説しています</a>。</p>



<p>EZRとは無料の統計ソフトであるRを、SPSSやJMPなどのようにマウス操作だけで解析を行うことができるソフトです。</p>



<p>EZRもRと同様に完全に無料であるため、統計解析を実施する誰もが実践できるソフトになっています。</p>



<p>2019年5月の時点で英文論文での引用回数が2400回を超えているとのことで、論文投稿するための解析ソフトとしても申し分ありません。</p>



<p>これを機に、EZRで統計解析を実施してみてはいかがでしょうか？</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>＞＞<a href="https://best-biostatistics.com/ezr/survival-curve.html" target="_blank" rel="noopener noreferrer">EZRで生存時間解析を実践する</a>。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<h2 class="wp-block-heading">まとめ</h2>



<p>生存時間解析は、打ち切りを考慮しながらイベントまでの時間を解析できる方法。</p>



<p>イベントの定義は、１度だけ起こる事象。</p>



<p>打ち切りの定義は、イベントが起こっていないこと。</p>



<div style="height:20px" aria-hidden="true" class="wp-block-spacer"></div>



<p>統計に関するご質問があれば、メルマガにご登録の上ご質問くださいませ！</p>



<p>＞＞<a href="https://best-biostatistics.com/lp2/seo/">メルマガ登録はこちら（無料プレゼントあります。</a>）</p>



<p>生存時間解析に関して動画でも解説していますので、合わせてご確認いただけると理解が進むはずです。</p>



<p class="has-text-align-center"><iframe width="560" height="315" src="https://www.youtube.com/embed/IUDAYLFKsDM" frameborder="0" allowfullscreen="allowfullscreen" data-mce-fragment="1"></iframe></p>
]]></content:encoded>
					
					<wfw:commentRss>https://best-biostatistics.com/surviv/survival.html/feed</wfw:commentRss>
			<slash:comments>10</slash:comments>
		
		
			</item>
		<item>
		<title>比例ハザード性とは？検証方法と成立しない場合の対処法もわかりやすく紹介！</title>
		<link>https://best-biostatistics.com/surviv/hirei-hazard.html</link>
					<comments>https://best-biostatistics.com/surviv/hirei-hazard.html#respond</comments>
		
		<dc:creator><![CDATA[beat1115]]></dc:creator>
		<pubDate>Tue, 10 Sep 2024 05:00:47 +0000</pubDate>
				<category><![CDATA[わかりやすい生存時間解析]]></category>
		<guid isPermaLink="false">https://best-biostatistics.com/?p=4668</guid>

					<description><![CDATA[<p><img src="https://best-biostatistics.com/wp/wp-content/uploads/2022/03/Youtubeアイキャッチ-12-1024x576.jpg" class="webfeedsFeaturedVisual" /></p>医学分野ではCox比例ハザードモデルという解析手法がよく使われます。 生存時間解析で2群の生存率を比較するときに非常に便利な解析なのですが、比例ハザード性というものが成立していないと使えません。 「比例ハザード性って何？ [&#8230;]]]></description>
										<content:encoded><![CDATA[<p><img src="https://best-biostatistics.com/wp/wp-content/uploads/2022/03/Youtubeアイキャッチ-12-1024x576.jpg" class="webfeedsFeaturedVisual" /></p>
<p>医学分野では<a href="https://best-biostatistics.com/surviv/cox.html">Cox比例ハザードモデル</a>という解析手法がよく使われます。</p>



<p><a href="https://best-biostatistics.com/surviv/survival.html">生存時間解析</a>で2群の生存率を比較するときに非常に便利な解析なのですが、比例ハザード性というものが成立していないと使えません。</p>



<p>「比例ハザード性って何？」<br>「どうやって検証するの？」<br>「比例ハザード性が成立しない場合にはどうすればいいの？」</p>



<p>といった疑問を持つ人も多いのではないでしょうか。</p>



<p><strong>本記事では比例ハザード性とは何か、その検証方法や成立しない場合の対処法について紹介します。</strong></p>



<h2 class="wp-block-heading">比例ハザード性とは？</h2>



<figure class="wp-block-image"><img decoding="async" width="1280" height="720" src="https://best-biostatistics.com/wp/wp-content/uploads/2020/09/なぜ_1599110898.jpg" alt="" class="wp-image-4213" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2020/09/なぜ_1599110898.jpg 1280w, https://best-biostatistics.com/wp/wp-content/uploads/2020/09/なぜ_1599110898-300x169.jpg 300w, https://best-biostatistics.com/wp/wp-content/uploads/2020/09/なぜ_1599110898-1024x576.jpg 1024w, https://best-biostatistics.com/wp/wp-content/uploads/2020/09/なぜ_1599110898-768x432.jpg 768w" sizes="(max-width: 1280px) 100vw, 1280px" /></figure>



<p>そもそも比例ハザード性とは何でしょうか？</p>



<p>紐解いていきましょう！</p>



<h3 class="wp-block-heading">比例ハザード性の定義</h3>



<p>まずは比例ハザード性の定義を調べてみましょう。</p>



<blockquote class="wp-block-quote is-layout-flow wp-block-quote-is-layout-flow">
<p>共変量の2群間において、ハザード比が時間によらず一定であること。</p>



<p class="has-text-align-right"><a href="https://bellcurve.jp/statistics/glossary/1159.html#:~:text=proportional%20hazard%20assumption,%E3%81%9A%E4%B8%80%E5%AE%9A%E3%81%A7%E3%81%82%E3%82%8B%E3%81%93%E3%81%A8%E3%80%82">統計WEBより</a></p>
</blockquote>



<p>まだ分かりづらいですよね。</p>



<p>ハザード比とは一体何のことでしょうか？</p>



<h3 class="wp-block-heading">ハザード比とはそもそも何？</h3>



<p>ハザード比とは、2群のハザードの比のことです。</p>



<p>ここで「ハザードって何？」と思いますよね。</p>



<p>まずはハザードとは何か解説していきますね。</p>



<p><span style="color: #ff0000;"><strong>ハザードとは、単位時間におけるイベントの発生率を示します。</strong></span></p>



<p>　</p>



<p>例えばある薬を使った群と使わなかった群で、数ヶ月の生存率を調べるとしましょう。</p>



<p>この場合、1ヶ月生存できた確率(1ヶ月後の生存者/現時点の生存者)をハザードと表現します。</p>



<p>ちなみにハザードは直訳で&#8221;危険&#8221;または&#8221;障害&#8221;という意味になります。</p>



<p>この2群間の生存率の比をハザード比と表現します。</p>



<p>　</p>



<h3 class="wp-block-heading">比例ハザード性が成立するのはどんな時？</h3>



<p><strong>比例ハザード性とは、2群間のハザード比が時間に限らず常に一定であることです。</strong></p>



<p>比例ハザード性が成立するのはどんな時なのか、先ほどの例を使ってみてみましょう。</p>



<p>以下の場合の<a href="https://best-biostatistics.com/surviv/km.html">カプランマイヤー曲線</a>は比例ハザード性が成立しています。</p>



<p>「薬を使った群が使っていない群よりも常に生存率が1.5倍だった」</p>



<figure class="wp-block-image"><img decoding="async" width="667" height="381" src="https://best-biostatistics.com/wp/wp-content/uploads/2021/06/Rplot.png" alt="" class="wp-image-4669" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2021/06/Rplot.png 667w, https://best-biostatistics.com/wp/wp-content/uploads/2021/06/Rplot-300x171.png 300w" sizes="(max-width: 667px) 100vw, 667px" /></figure>



<p>　</p>



<p>反対に、以下の場合は比例ハザード性が成立していません。</p>



<p>「薬を使った群と使っていない群で、最初は生存率に差がなかったが、12ヶ月後以降は差がみられるようになった」</p>



<figure class="wp-block-image"><img decoding="async" width="667" height="381" src="https://best-biostatistics.com/wp/wp-content/uploads/2021/06/Rplot01.png" alt="" class="wp-image-4670" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2021/06/Rplot01.png 667w, https://best-biostatistics.com/wp/wp-content/uploads/2021/06/Rplot01-300x171.png 300w" sizes="(max-width: 667px) 100vw, 667px" /></figure>



<p>　</p>



<p>この場合、最初はハザード比が1倍でしたが、12ヶ月以降あたりからハザード比がかなり大きくなっています。</p>



<p>この場合ハザード比は時間によらず一定ではないので、比例ハザード性は成立しません。</p>



<p>このようにデータによって比例ハザード性が成立したり、しなかったりするわけです。</p>



<p>生存曲線の作り方は<span style="color: #3366ff;"><a style="color: #3366ff;" href="https://best-biostatistics.com/ezr/survival-curve.html">EZRでカプランマイヤー曲線を作る！という記事</a></span>をご覧ください。</p>



<h2 class="wp-block-heading">比例ハザード性の検証方法</h2>



<figure class="wp-block-image"><img decoding="async" src="https://best-biostatistics.com/wp/wp-content/uploads/2021/04/good-1123013_1920.jpg" alt="" class="wp-image-4499"/></figure>



<p>　</p>



<p><strong>実は、比例ハザード性を検証する客観的な方法はまだ確立されていないというのが現状です。</strong></p>



<p>実際に比例ハザード性の検証したい時は、以下の2通りの方法で可能です。</p>



<ol class="wp-block-list">
<li><strong>生存曲線を目視で確認する</strong></li>



<li><strong>層別log-logプロットの平行性を確認する</strong></li>
</ol>



<h3 class="wp-block-heading">①生存曲線を目視で確認する</h3>



<p><strong>比例ハザード性を検証するなら、ひとまず生存曲線を確認する方法が一番おすすめです。</strong></p>



<p>比例ハザード性が成立するかどうかは、先ほどの例のように生存曲線をみれば大体わかるからです。</p>



<p>生存曲線をグラフ化したときに、2群とも同じような下がり方をしていれば、比例ハザード性は成立していると考えていいでしょう。</p>



<p>反対に、片方の群だけ途中から明らかに下がり方が変わっている場合は、比例ハザード性が成立していないと考えましょう。</p>



<p>この場合そのままCox比例ハザード分析にかけることは出来ませんので、対策が必要です(後ほど解説します)。</p>



<h3 class="wp-block-heading">②層別log-logプロットの平行性を確認する</h3>



<p><strong>①の方法よりももう少しちゃんと比例ハザード性を検証したいときは、層別log-logプロットというものを作り、平行性を確認しましょう。</strong></p>



<p>これは生存時間関数の対数をとった後、符号を反転してもう一度対数をとった関数をプロットしたグラフです。</p>



<p>どうして回りくどい変換をするのは難しい話になるのでここでは割愛します。</p>



<p>ただ、この変換を行うことで比例ハザード性が成立する場合に2つの線が平行になるようになります。</p>



<p>比例ハザード性が成立しない場合は、線が交わったりして平行になりません。</p>



<p>ただこの方法も結局最後は目視での確認ですので、客観性があるとは言い難いです。</p>



<p>基本的には①の生存曲線を目視で確認して大きなズレがなければ比例ハザード性に問題はないと判断してOKでしょう。</p>



<h2 class="wp-block-heading">比例ハザード性が成立しない場合にはどうすればいい？</h2>



<figure class="wp-block-image"><img decoding="async" width="1280" height="995" src="https://best-biostatistics.com/wp/wp-content/uploads/2021/04/クエスチョン_1619616127.png" alt="" class="wp-image-4521" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2021/04/クエスチョン_1619616127.png 1280w, https://best-biostatistics.com/wp/wp-content/uploads/2021/04/クエスチョン_1619616127-300x233.png 300w, https://best-biostatistics.com/wp/wp-content/uploads/2021/04/クエスチョン_1619616127-1024x796.png 1024w, https://best-biostatistics.com/wp/wp-content/uploads/2021/04/クエスチョン_1619616127-768x597.png 768w" sizes="(max-width: 1280px) 100vw, 1280px" /></figure>



<p>　</p>



<p><strong>比例ハザード性が成立しない変数は、Cox比例ハザードモデルに組み込むことができません。</strong></p>



<p>その場合は、以下の対処法があります。</p>



<ol class="wp-block-list">
<li><strong>層別Cox比例ハザードモデルを使用する</strong></li>



<li><strong>時間依存共変量を取り込む</strong></li>



<li><strong>関数に非線形項を追加する</strong></li>
</ol>



<p>この内②と③は上級者向きですので、統計に詳しくない方は①の方法を検討するのが良いと思います。</p>



<p>　</p>



<h3 class="wp-block-heading">層別Cox比例ハザードモデルとは？</h3>



<p>層別Cox比例ハザードモデルとは、対象者をある共変量で何層かに分割してCox比例ハザードモデルにかける方法。</p>



<p>先ほどご説明したとおり、比例ハザード性が成立しない変数はモデルに加えられないため、あらかじめ層に分けてしまおうという考え方です。</p>



<p>例を使って考えていきましょう。</p>



<p>　</p>



<p>例えばある薬を使った群と使っていない群で生存率を調べたいときに、性別を共変量としてCox比例ハザードモデルに組み込みたいとしましょう。</p>



<p>しかし性別と生存率のハザード比が比例しませんでした。</p>



<p>この場合、全体の対象者をあらかじめ男性と女性の2層に分けておきます。</p>



<p>2層を別々に解析することで性別を共変量に組み込まずに解析ができるというわけです。</p>



<p>ちなみに今回は性別を使いましたが、年齢などで何層かに分けることも可能です。</p>



<p>ただしどのように層別化するか決まりはなく、恣意的(都合のいい結果が出るところで層を分ける)に分析ができてしまうという欠点があります。</p>



<p><span class="marker"><strong>層別Cox比例ハザードモデルを使う時は先行研究を参考にして、なるべくオーソドックスな分け方をするようにしましょう</strong></span>。</p>



<p>　</p>



<p>②と③については詳しい説明を省きますが、いずれも時間に比例しない変数を加える方法です。</p>



<p>②はそんな都合の良い変数を見つけなければなりませんし、③は作り出さなければなりません。</p>



<p>どちらも数学的な知識がないと失敗しやすい方法です。</p>



<p>たいていは層別モデルで対応できるため、初心者のうちは①の方法をおすすめします。</p>



<h2 class="wp-block-heading">まとめ</h2>



<figure class="wp-block-image"><img decoding="async" width="1280" height="847" src="https://best-biostatistics.com/wp/wp-content/uploads/2021/05/town-sign-1148092_1280.jpg" alt="" class="wp-image-4545" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2021/05/town-sign-1148092_1280.jpg 1280w, https://best-biostatistics.com/wp/wp-content/uploads/2021/05/town-sign-1148092_1280-300x199.jpg 300w, https://best-biostatistics.com/wp/wp-content/uploads/2021/05/town-sign-1148092_1280-1024x678.jpg 1024w, https://best-biostatistics.com/wp/wp-content/uploads/2021/05/town-sign-1148092_1280-768x508.jpg 768w" sizes="(max-width: 1280px) 100vw, 1280px" /></figure>



<p>　</p>



<p>最後におさらいをしましょう。</p>



<div class="simple-box7">
<ul>
<li>比例ハザード性とは時間に関係なくハザード比が一定であること</li>
<li>生存曲線をプロット(グラフ化)することで比例ハザード性を確認できる</li>
<li>比例ハザード性を確かめる客観的指標は確立されていない</li>
<li>比例ハザード性が成立しない場合は層別Cox比例ハザードモデルを使用する</li>
</ul>
</div>



<p>Cox比例ハザード分析を使用した論文は多くありますが、比例ハザード性の検討を怠っている方は案外多いように感じています。</p>



<p>間違った結果を発表しないためにも、注意する癖をつけておきたいですね。</p>



<p>今回は比例ハザード性について解説させて頂きましたが、<a href="https://best-biostatistics.com/category/surviv">生存曲線解析について解説した記事がこちらにもありますので、よければ一緒にご覧ください。</a></p>



<p>最後までお読み頂きありがとうございました。</p>
]]></content:encoded>
					
					<wfw:commentRss>https://best-biostatistics.com/surviv/hirei-hazard.html/feed</wfw:commentRss>
			<slash:comments>0</slash:comments>
		
		
			</item>
		<item>
		<title>Number at Riskとは統計でどんな意味？累積生存率との関係</title>
		<link>https://best-biostatistics.com/surviv/number_at_risk.html</link>
					<comments>https://best-biostatistics.com/surviv/number_at_risk.html#respond</comments>
		
		<dc:creator><![CDATA[beat1115]]></dc:creator>
		<pubDate>Fri, 28 Jun 2024 09:41:08 +0000</pubDate>
				<category><![CDATA[わかりやすい生存時間解析]]></category>
		<guid isPermaLink="false">https://best-biostatistics.com/?p=5445</guid>

					<description><![CDATA[<p><img src="https://best-biostatistics.com/wp/wp-content/uploads/2021/12/統計のYoutubeアイキャッチ-14-1024x576.jpg" class="webfeedsFeaturedVisual" /></p>この記事では「Number at Riskとは統計でどんな意味？累積生存率との関係」ということでお伝えします。 カプランマイヤー曲線の下になんとなく数字がついているのを見たことがあるけど、どんな意味を持っているのかわから [&#8230;]]]></description>
										<content:encoded><![CDATA[<p><img src="https://best-biostatistics.com/wp/wp-content/uploads/2021/12/統計のYoutubeアイキャッチ-14-1024x576.jpg" class="webfeedsFeaturedVisual" /></p><p>この記事では「Number at Riskとは統計でどんな意味？累積生存率との関係」ということでお伝えします。</p>
<p>カプランマイヤー曲線の下になんとなく数字がついているのを見たことがあるけど、どんな意味を持っているのかわからない。。。</p>
<p>という方もいらっしゃるのではないでしょうか。</p>
<ul>
<li><strong>Number at Riskがどんな意味を持つのか？</strong></li>
<li><strong>Number at Riskが累積生存率にどう影響を及ぼすのか</strong></li>
</ul>
<p>ということが理解できるようになりますよ！</p>
<h2>Number at Riskとは？どんな意味を持つ？</h2>
<p><img decoding="async" class="alignnone size-full wp-image-5417" src="https://best-biostatistics.com/wp/wp-content/uploads/2021/12/AdobeStock_217038618-scaled-e1638912488282.jpeg" alt="" width="2560" height="1305" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2021/12/AdobeStock_217038618-scaled-e1638912488282.jpeg 2560w, https://best-biostatistics.com/wp/wp-content/uploads/2021/12/AdobeStock_217038618-scaled-e1638912488282-300x153.jpeg 300w, https://best-biostatistics.com/wp/wp-content/uploads/2021/12/AdobeStock_217038618-scaled-e1638912488282-1024x522.jpeg 1024w, https://best-biostatistics.com/wp/wp-content/uploads/2021/12/AdobeStock_217038618-scaled-e1638912488282-768x392.jpeg 768w, https://best-biostatistics.com/wp/wp-content/uploads/2021/12/AdobeStock_217038618-scaled-e1638912488282-1536x783.jpeg 1536w, https://best-biostatistics.com/wp/wp-content/uploads/2021/12/AdobeStock_217038618-scaled-e1638912488282-2048x1044.jpeg 2048w" sizes="(max-width: 2560px) 100vw, 2560px" /></p>
<p>Number at Riskは、生存時間解析で用いられる用語。</p>
<p>特に、<a href="https://best-biostatistics.com/surviv/km.html">カプランマイヤー曲線</a>の下についている数字です。</p>
<p>例えば、下記のカプランマイヤー曲線でもNumber at Riskが出力されていますね。</p>
<p><img decoding="async" class="alignnone size-full wp-image-5446 aligncenter" src="https://best-biostatistics.com/wp/wp-content/uploads/2021/12/Quartz_2.jpg" alt="" width="602" height="745" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2021/12/Quartz_2.jpg 602w, https://best-biostatistics.com/wp/wp-content/uploads/2021/12/Quartz_2-242x300.jpg 242w" sizes="(max-width: 602px) 100vw, 602px" /></p>
<p>Number at Riskは日本語では<span class="marker"><strong>「リスク人数」</strong></span>と呼ばれていて、その直前の時点までに残っている人数を示しています。</p>
<p>生存時間解析はイベントが起こるまでの時間をアウトカムとします。</p>
<p>その際に、<span class="marker"><strong>今後イベントを起こすリスクがある人数</strong></span>、という意味ですね。</p>
<p>例えば上記のカプランマイヤー曲線では、500日目のA群のNumber at Riskは19人。</p>
<p>500日目の直前まで、<span style="text-decoration: underline;"><strong>A群では19人が試験に残っている（今後イベントを起こすリスクがある）ということを意味しています</strong></span>。</p>
<p>そして、累積生存率を計算するための分母になる人数でもあります。</p>
<p>これは後ほどまた説明しますね。</p>
<h2>Number at Riskから累積生存率はどう計算される？</h2>
<p><img decoding="async" class="alignnone size-full wp-image-5419" src="https://best-biostatistics.com/wp/wp-content/uploads/2021/12/AdobeStock_339409725-scaled-e1638913182732.jpeg" alt="" width="2560" height="1350" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2021/12/AdobeStock_339409725-scaled-e1638913182732.jpeg 2560w, https://best-biostatistics.com/wp/wp-content/uploads/2021/12/AdobeStock_339409725-scaled-e1638913182732-300x158.jpeg 300w, https://best-biostatistics.com/wp/wp-content/uploads/2021/12/AdobeStock_339409725-scaled-e1638913182732-1024x540.jpeg 1024w, https://best-biostatistics.com/wp/wp-content/uploads/2021/12/AdobeStock_339409725-scaled-e1638913182732-768x405.jpeg 768w, https://best-biostatistics.com/wp/wp-content/uploads/2021/12/AdobeStock_339409725-scaled-e1638913182732-1536x810.jpeg 1536w, https://best-biostatistics.com/wp/wp-content/uploads/2021/12/AdobeStock_339409725-scaled-e1638913182732-2048x1080.jpeg 2048w" sizes="(max-width: 2560px) 100vw, 2560px" /></p>
<p>Number at Riskは累積生存率を計算するための分母になる人数です。</p>
<p>これはどういうことか。</p>
<p>例を用いて考えてみましょう。</p>
<h3>Number at Riskが累積生存率に及ぼす影響</h3>
<p>以下の3つの状況を見てみます。</p>
<p>試験には3人参加しており、2人はイベントを起こし、1人は打ち切りだった場合、という想定。</p>
<p><img decoding="async" class="alignnone size-full wp-image-5447" src="https://best-biostatistics.com/wp/wp-content/uploads/2021/12/ScreenShot-2021-12-15-11.23.00.png" alt="" width="1976" height="774" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2021/12/ScreenShot-2021-12-15-11.23.00.png 1976w, https://best-biostatistics.com/wp/wp-content/uploads/2021/12/ScreenShot-2021-12-15-11.23.00-300x118.png 300w, https://best-biostatistics.com/wp/wp-content/uploads/2021/12/ScreenShot-2021-12-15-11.23.00-1024x401.png 1024w, https://best-biostatistics.com/wp/wp-content/uploads/2021/12/ScreenShot-2021-12-15-11.23.00-768x301.png 768w, https://best-biostatistics.com/wp/wp-content/uploads/2021/12/ScreenShot-2021-12-15-11.23.00-1536x602.png 1536w" sizes="(max-width: 1976px) 100vw, 1976px" /></p>
<p>打ち切りが発生する状況が違います。</p>
<p>この時に、解析結果がどうなるのか？を考えてみましょう。</p>
<h4>状況1での解析結果</h4>
<p>まずは状況1での解析結果。</p>
<p>結論から示すと、結果としてはこんな感じになります。</p>
<p><img decoding="async" class="alignnone size-full wp-image-5448" src="https://best-biostatistics.com/wp/wp-content/uploads/2021/12/ScreenShot-2021-12-15-11.24.31.png" alt="" width="1956" height="924" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2021/12/ScreenShot-2021-12-15-11.24.31.png 1956w, https://best-biostatistics.com/wp/wp-content/uploads/2021/12/ScreenShot-2021-12-15-11.24.31-300x142.png 300w, https://best-biostatistics.com/wp/wp-content/uploads/2021/12/ScreenShot-2021-12-15-11.24.31-1024x484.png 1024w, https://best-biostatistics.com/wp/wp-content/uploads/2021/12/ScreenShot-2021-12-15-11.24.31-768x363.png 768w, https://best-biostatistics.com/wp/wp-content/uploads/2021/12/ScreenShot-2021-12-15-11.24.31-1536x726.png 1536w" sizes="(max-width: 1956px) 100vw, 1956px" /></p>
<p>時点1の直前までは3人が参加しているので、Number at Riskは3。</p>
<p>そして、時点1では1名がイベントを起こしているため、残りは2人。</p>
<p>だから2/3の生存率ですね。</p>
<p>この時、分母はNumber at Riskであり、分子はイベントの非発生例、ということになります。</p>
<p>次に時点2。</p>
<p>時点2の直前までは2人が残っているので、Number at Riskは2。（1名は時点1でイベントを起こしているため）</p>
<p>そして、時点2では1名が打ち切りを起こしています。</p>
<p>この時、<span style="text-decoration: underline;"><strong>イベントを起こしている人は0人</strong></span>です。</p>
<p>なので、この時の累積生存率は、<span class="marker"><strong>2/3*2/2=2/3</strong></span>となります。</p>
<p>それまでの生存率に、時点2の生存率を掛けたもの。</p>
<p>時点2の生存率は2/2であり、分母はNumber at Risk、そして分子はイベントの非発生例、です。</p>
<p><span style="text-decoration: underline;"><strong>打ち切りは起こしていますが、イベントを起こして人はいないため、あくまで分子は2</strong></span>なのです。</p>
<p>次に時点3。</p>
<p>時点3の直前までは1人が残っているので、Number at Riskは1。（1名は時点1でイベントを起こしており、1名は時点2で打ち切りを起こしているため）</p>
<p>そして、時点3では1名がイベントを起こしているため、残りは0人。</p>
<p>だから<span class="marker"><strong>2/3*0/1=0</strong></span>の累積生存率ですね。</p>
<p>この時、分母はNumber at Riskであり、分子はイベントの非発生例、ということになります。</p>
<p>このような計算をしてカプランマイヤー曲線が示されているのです。</p>
<h4>状況2での解析結果</h4>
<p>次に状況2での解析結果。</p>
<p>結論から示すと、結果としてはこんな感じになります。</p>
<p><img decoding="async" class="alignnone size-full wp-image-5449" src="https://best-biostatistics.com/wp/wp-content/uploads/2021/12/ScreenShot-2021-12-15-11.25.41.png" alt="" width="1968" height="926" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2021/12/ScreenShot-2021-12-15-11.25.41.png 1968w, https://best-biostatistics.com/wp/wp-content/uploads/2021/12/ScreenShot-2021-12-15-11.25.41-300x141.png 300w, https://best-biostatistics.com/wp/wp-content/uploads/2021/12/ScreenShot-2021-12-15-11.25.41-1024x482.png 1024w, https://best-biostatistics.com/wp/wp-content/uploads/2021/12/ScreenShot-2021-12-15-11.25.41-768x361.png 768w, https://best-biostatistics.com/wp/wp-content/uploads/2021/12/ScreenShot-2021-12-15-11.25.41-1536x723.png 1536w" sizes="(max-width: 1968px) 100vw, 1968px" /></p>
<p>時点1は状況1と同じなので、2/3でいいですよね。</p>
<p>じゃあ時点2はというと、直前までは2名いるため、Number at Riskは2でイベント発生が1名。</p>
<p>なので、<span style="text-decoration: underline;"><strong>2/3*1/2=1/3</strong></span>という累積生存率になります。</p>
<p>最後の時点3は打ち切り。</p>
<p>Number at Riskは相変わらず1ですが、時点3では打ち切りが発生して、イベントは発生していない。</p>
<p>なので、<span class="marker"><strong>1/3*1/1=1/3</strong></span>という計算結果に。</p>
<p>そしてそれ以降の情報はありませんので、ここでカプランマイヤー曲線は終了、ということになります。</p>
<h4>状況3での解析結果</h4>
<p>最後に状況3での解析結果。</p>
<p>結論から示すと、結果としてはこんな感じになります。</p>
<p><img decoding="async" class="alignnone size-full wp-image-5450" src="https://best-biostatistics.com/wp/wp-content/uploads/2021/12/ScreenShot-2021-12-15-11.26.24.png" alt="" width="1948" height="920" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2021/12/ScreenShot-2021-12-15-11.26.24.png 1948w, https://best-biostatistics.com/wp/wp-content/uploads/2021/12/ScreenShot-2021-12-15-11.26.24-300x142.png 300w, https://best-biostatistics.com/wp/wp-content/uploads/2021/12/ScreenShot-2021-12-15-11.26.24-1024x484.png 1024w, https://best-biostatistics.com/wp/wp-content/uploads/2021/12/ScreenShot-2021-12-15-11.26.24-768x363.png 768w, https://best-biostatistics.com/wp/wp-content/uploads/2021/12/ScreenShot-2021-12-15-11.26.24-1536x725.png 1536w" sizes="(max-width: 1948px) 100vw, 1948px" /></p>
<p>時点1は打ち切りです。</p>
<p>なので、Number at Riskは相変わらず3ですが、時点1では打ち切りが発生して、イベントは発生していない。</p>
<p>だから、3/3=1というのが累積生存率です。</p>
<p>じゃあ時点2はというと、直前までは2名いるため、Number at Riskは2でイベント発生が1名。</p>
<p>だから、<span style="text-decoration: underline;"><strong>1*1/2=1/2</strong></span>という計算結果。</p>
<p>そして時点3は1名イベントを起こしています。</p>
<p>だから、1/2*0/1=0という累積生存率になるのです。</p>
<h3>状況の違いでNumber at Riskや累積生存率はどう変化したか？</h3>
<p>これまで3つの状況を見てきた通り、<span class="marker"><strong>イベントが起こっても打ち切りが起こってもその後にリスク人数が減ることは同じ</strong></span>でしたね。</p>
<p>そのため、3つの状況でNumber at Riskは全時点で同じ。</p>
<p>しかし、イベントなのか打ち切りなのかによって、累積生存率を計算する際の分子の数値が違います。</p>
<p>なので、その時点の生存率計算も異なるし、結果としてカプランマイヤー曲線も変わります。</p>
<h2>まとめ</h2>
<p><img decoding="async" class="alignnone size-full wp-image-5260" src="https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_352132012-scaled.jpeg" alt="" width="2560" height="1745" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_352132012-scaled.jpeg 2560w, https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_352132012-300x205.jpeg 300w, https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_352132012-1024x698.jpeg 1024w, https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_352132012-768x524.jpeg 768w, https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_352132012-1536x1047.jpeg 1536w, https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_352132012-2048x1396.jpeg 2048w" sizes="(max-width: 2560px) 100vw, 2560px" /></p>
<p>いかがでしたか？</p>
<p>この記事では「Number at Riskとは統計でどんな意味？累積生存率との関係」ということでお伝えしました。</p>
<ul>
<li><strong>Number at Riskがどんな意味を持つのか？</strong></li>
<li><strong>Number at Riskが累積生存率にどう影響を及ぼすのか</strong></li>
</ul>
<p>ということが理解できたのなら幸いです！</p>
<p><a href="https://best-biostatistics.com/surviv/km.html">カプランマイヤー曲線</a>、<a href="https://best-biostatistics.com/surviv/logrank.html">ログランク検定</a>、<a href="https://best-biostatistics.com/surviv/cox.html">Cox比例ハザードモデル</a>は、<a href="https://best-biostatistics.com/surviv/survival.html">生存時間解析</a>の3種の神器と言ってもいいほど頻出しますので、ぜひ理解しましょう！</p>
<p>こちらの内容は動画でも解説していますので、併せてご確認くださいませ。</p>
<p><iframe title="Number at Risk とは？どんな意味を持つのか？" width="500" height="281" src="https://www.youtube.com/embed/KJUeC3ocymI?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe></p>
]]></content:encoded>
					
					<wfw:commentRss>https://best-biostatistics.com/surviv/number_at_risk.html/feed</wfw:commentRss>
			<slash:comments>0</slash:comments>
		
		
			</item>
		<item>
		<title>ハザード比をわかりやすく解説！リスク比やオッズ比とどう違う？</title>
		<link>https://best-biostatistics.com/surviv/hazard-ratio.html</link>
					<comments>https://best-biostatistics.com/surviv/hazard-ratio.html#respond</comments>
		
		<dc:creator><![CDATA[beat1115]]></dc:creator>
		<pubDate>Wed, 01 May 2024 22:38:17 +0000</pubDate>
				<category><![CDATA[わかりやすい生存時間解析]]></category>
		<guid isPermaLink="false">https://best-biostatistics.com/?p=5352</guid>

					<description><![CDATA[<p><img src="https://best-biostatistics.com/wp/wp-content/uploads/2021/11/統計のYoutubeアイキャッチ-3-1024x576.jpg" class="webfeedsFeaturedVisual" /></p>この記事は「ハザード比をわかりやすく解説！リスク比やオッズ比とどう違う？」ということでお伝えします！ &#160; ハザード比ってそもそもどんな指標なの？ ハザード比はリスク比やオッズ比とどう違う？ ログランク検定ではハ [&#8230;]]]></description>
										<content:encoded><![CDATA[<p><img src="https://best-biostatistics.com/wp/wp-content/uploads/2021/11/統計のYoutubeアイキャッチ-3-1024x576.jpg" class="webfeedsFeaturedVisual" /></p><p>この記事は「ハザード比をわかりやすく解説！リスク比やオッズ比とどう違う？」ということでお伝えします！</p>
<p>&nbsp;</p>
<ul>
<li><strong>ハザード比ってそもそもどんな指標なの？</strong></li>
<li><strong>ハザード比はリスク比やオッズ比とどう違う？</strong></li>
<li><strong>ログランク検定ではハザード比が出ないんだけどどうすれば良い？</strong></li>
</ul>
<p>&nbsp;</p>
<p>といったことが理解できるようになります！</p>
<h2>ハザード比をわかりやすく説明するとどんな指標？</h2>
<p><img decoding="async" class="alignnone size-full wp-image-5324" src="https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_363064559-scaled-e1637538765888.jpeg" alt="" width="2560" height="992" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_363064559-scaled-e1637538765888.jpeg 2560w, https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_363064559-scaled-e1637538765888-300x116.jpeg 300w, https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_363064559-scaled-e1637538765888-1024x397.jpeg 1024w, https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_363064559-scaled-e1637538765888-768x298.jpeg 768w, https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_363064559-scaled-e1637538765888-1536x595.jpeg 1536w, https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_363064559-scaled-e1637538765888-2048x794.jpeg 2048w" sizes="(max-width: 2560px) 100vw, 2560px" /></p>
<p>ハザード比は「ハザード」の「比」なので、ハザード比を理解するには本質的に「ハザード」を理解する必要があります。</p>
<p>ハザードという指標は<a href="https://best-biostatistics.com/surviv/survival.html">生存時間解析</a>で使われている指標で、定義としては<span style="color: #ff0000;"><strong>「単位時間あたりのイベント発生率」</strong></span>になります。</p>
<p>生存時間解析では「その被験者にイベントが起こったかどうか」と同時に<span class="marker"><strong>「いつイベントが起こったのか」という「期間（時間）」の情報がすごく重要になるんです</strong></span>。</p>
<p>そのためハザードは、「期間（時間）」を考慮したイベント発生率の指標である、というイメージを持っていただければOKです。</p>
<p>&nbsp;</p>
<h3>ハザードがわかればハザード比は理解しやすい</h3>
<p>ハザードが分かれば、ハザード比は理解しやすいです。</p>
<p>ハザード比はその名の通り、各群のハザードの「比」を取ったものだからです。</p>
<p>分子と分母が同じ値であればハザード比は1を取ります。</p>
<p>そのため、<a href="https://best-biostatistics.com/hypo_test/hypo.html">帰無仮説</a>の値はハザード比（HR）＝1です。</p>
<p><span class="marker"><strong>通常は比較相手の群（標準治療群やプラセボ群）を分母として比を取るため、ハザード比が1より小さければ新薬群の方がイベントを起こしにくく、ハザード比が1より大きければ新薬群の方がイベントを起こしやすい、ということが分かります</strong></span>。</p>
<p>&nbsp;</p>
<h2>ハザード比はリスク比やオッズ比とどう違う？</h2>
<p><img decoding="async" class="alignnone size-full wp-image-5275" src="https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_72001980-scaled-e1636682159326.jpeg" alt="" width="2560" height="1280" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_72001980-scaled-e1636682159326.jpeg 2560w, https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_72001980-scaled-e1636682159326-300x150.jpeg 300w, https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_72001980-scaled-e1636682159326-1024x512.jpeg 1024w, https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_72001980-scaled-e1636682159326-768x384.jpeg 768w, https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_72001980-scaled-e1636682159326-1536x768.jpeg 1536w, https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_72001980-scaled-e1636682159326-2048x1024.jpeg 2048w" sizes="(max-width: 2560px) 100vw, 2560px" /></p>
<p>ハザード比が理解できたところで、次なる疑問が出てくるかもしれないですね。</p>
<p>それは<span class="marker"><strong>「ハザード比はリスク比やオッズ比とどう違うの？」</strong></span>という疑問。</p>
<p><a href="https://best-biostatistics.com/contingency/odds_risk.html">リスク比とオッズ比に関してはこちらの記事で詳しく解説</a>しているため、ある程度理解している前提で進みますね。</p>
<p>&nbsp;</p>
<p>その違いを結論からお伝えすると、<span class="marker"><strong>リ</strong><strong>スク比とオッズ比は「イベントの有無」だけを情報として扱っているのに対して、ハザード比はイベントの有無と「期間（時間）」を考慮しているという点が違い</strong></span>です。</p>
<p>&nbsp;</p>
<p><div class="swell-block-capbox cap_box is-style-onborder_ttl2">
				<div class="cap_box_ttl"><i class="jic jin-ifont-post"></i><span>ハザード比がリスク比やオッズ比と異なる点</span></div>
				<div class="cap_box_content"> </p>
<p>リスク比とオッズ比は「イベントの有無」だけを情報として扱うのに対して、「時間」を考慮しているかどうかがハザード比との違い</p>
<p></div>
			</div></p>
<p>&nbsp;</p>
<p>しかし上記の違いがあることだけを理解しておけば、結果の見方などは両者に違いがありません。</p>
<p>つまり、<span style="text-decoration: underline;"><strong>比が1であれば群間に差がないですし、1から遠ければ群間差がある、という結果の見方は、ハザード比でもリスク比でもオッズ比でも同じ</strong></span>、ということです。</p>
<p>&nbsp;</p>
<h3>ハザード比、リスク比、オッズ比が解析結果に出力される回帰分析</h3>
<p>ハザード比、リスク比、オッズ比はそれぞれどのような<a href="https://best-biostatistics.com/correlation_regression/variables.html">回帰分析</a>の結果から出力されるでしょうか？</p>
<p>結論から言えば、下記の回帰分析になります。</p>
<p>&lt;div class=&#8221;concept-box6&#8243;&gt;&lt;p&gt;</p>
<ul>
<li>ハザード比：<a href="https://best-biostatistics.com/surviv/cox.html">Cox比例ハザードモデル</a></li>
<li>リスク比：<a href="https://best-biostatistics.com/correlation_regression/negative-binomial.html">ポアソン回帰（負の二項回帰）</a></li>
<li>オッズ比：<a href="https://best-biostatistics.com/correlation_regression/logistic.html">ロジスティック回帰</a>&lt;/p&gt;&lt;/div&gt;</li>
</ul>
<p>各解析によって、得られる結果の推定値は変わりますので、研究の目的に応じてどの解析を実施するのか、決めなければなりません！</p>
<p>&nbsp;</p>
<h2>ログランク検定ではハザード比が出ない！どうやって解析すると出力できる？</h2>
<p><img decoding="async" class="alignnone size-full wp-image-5230" src="https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_219633191-scaled-e1635835487880.jpeg" alt="" width="2560" height="1472" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_219633191-scaled-e1635835487880.jpeg 2560w, https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_219633191-scaled-e1635835487880-300x173.jpeg 300w, https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_219633191-scaled-e1635835487880-1024x589.jpeg 1024w, https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_219633191-scaled-e1635835487880-768x442.jpeg 768w, https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_219633191-scaled-e1635835487880-1536x883.jpeg 1536w, https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_219633191-scaled-e1635835487880-2048x1178.jpeg 2048w" sizes="(max-width: 2560px) 100vw, 2560px" /></p>
<p>ハザード比が生存時間解析で使われており、リスク比やオッズ比との違いも理解できたかと思います。</p>
<p>では次に、<span style="text-decoration: underline;"><strong>「ハザード比は実際の解析でどうやって出力すればいいのか？」</strong></span>という点について解説します。</p>
<p>&nbsp;</p>
<p><a href="https://best-biostatistics.com/surviv/logrank.html">生存時間解析で最も有名な解析手法といえば、ログランク検定</a>ですよね。</p>
<p>ログランク検定でハザード比を出力できればいいのですが、実はログランク検定ではハザード比を推定できないのです。</p>
<p>実際に<a href="https://best-biostatistics.com/ezr/survival-curve.html">EZRでログランク検定</a>を実施してみると、下記のような結果しか出力されません。</p>
<p><img decoding="async" class="alignnone size-full wp-image-5353 aligncenter" src="https://best-biostatistics.com/wp/wp-content/uploads/2021/11/ScreenShot-2021-11-25-9.31.46.png" alt="" width="467" height="93" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2021/11/ScreenShot-2021-11-25-9.31.46.png 467w, https://best-biostatistics.com/wp/wp-content/uploads/2021/11/ScreenShot-2021-11-25-9.31.46-300x60.png 300w" sizes="(max-width: 467px) 100vw, 467px" /></p>
<p>生存期間の中央値とその95%信頼区間、そして検定結果（P値）が出力されます。</p>
<p>それにプラスして、<a href="https://best-biostatistics.com/surviv/km.html">カプランマイヤー曲線</a>も出力されます。</p>
<p><img decoding="async" class="alignnone size-full wp-image-5354 aligncenter" src="https://best-biostatistics.com/wp/wp-content/uploads/2021/11/ScreenShot-2021-11-25-9.32.22.png" alt="" width="614" height="588" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2021/11/ScreenShot-2021-11-25-9.32.22.png 614w, https://best-biostatistics.com/wp/wp-content/uploads/2021/11/ScreenShot-2021-11-25-9.32.22-300x287.png 300w" sizes="(max-width: 614px) 100vw, 614px" /></p>
<p>ログランク検定でハザード比を出力できないとなると、ハザード比はどうやって出力させればいいのでしょうか？</p>
<p>&nbsp;</p>
<p>結論としては、<span class="marker"><strong>Cox比例ハザードモデル（Cox回帰）でハザード比を出力させる</strong></span>必要があります。</p>
<p>実際に上記のログランク検定と同じデータに対して、<a href="https://best-biostatistics.com/ezr/cox-reg.html">EZRでCox比例ハザードモデル（Cox回帰）を実施</a>すると、以下のような結果が出力されます。</p>
<p><img decoding="async" class="alignnone size-full wp-image-5355 aligncenter" src="https://best-biostatistics.com/wp/wp-content/uploads/2021/11/ScreenShot-2021-11-25-9.33.23.png" alt="" width="566" height="75" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2021/11/ScreenShot-2021-11-25-9.33.23.png 566w, https://best-biostatistics.com/wp/wp-content/uploads/2021/11/ScreenShot-2021-11-25-9.33.23-300x40.png 300w" sizes="(max-width: 566px) 100vw, 566px" /></p>
<p>ハザード比とその<a href="https://best-biostatistics.com/summary/95ci.html">95%信頼区間</a>、そして検定結果（P値）が出力されていることがわかります。</p>
<p>無事にハザード比を出力させることができましたね。</p>
<p>&nbsp;</p>
<h3>ログランク検定とCox比例ハザードモデルのP値が違う！どっちを使えばいいの？</h3>
<p>もしかしたら気付いた方もいるかもしれませんが、ログランク検定とCox比例ハザードモデル（Cox回帰）のP値が異なっています。</p>
<p>もう一度、ログランク検定とCox比例ハザードモデルの結果を載せますね。</p>
<p>&nbsp;</p>
<p><span style="text-decoration: underline;"><strong>↓ログランク検定の結果</strong></span></p>
<p><img decoding="async" class="alignnone size-full wp-image-5353" src="https://best-biostatistics.com/wp/wp-content/uploads/2021/11/ScreenShot-2021-11-25-9.31.46.png" alt="" width="467" height="93" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2021/11/ScreenShot-2021-11-25-9.31.46.png 467w, https://best-biostatistics.com/wp/wp-content/uploads/2021/11/ScreenShot-2021-11-25-9.31.46-300x60.png 300w" sizes="(max-width: 467px) 100vw, 467px" /></p>
<p><span style="text-decoration: underline;"><strong>↓Cox比例ハザードモデルの結果</strong></span></p>
<p><img decoding="async" class="alignnone size-full wp-image-5355" src="https://best-biostatistics.com/wp/wp-content/uploads/2021/11/ScreenShot-2021-11-25-9.33.23.png" alt="" width="566" height="75" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2021/11/ScreenShot-2021-11-25-9.33.23.png 566w, https://best-biostatistics.com/wp/wp-content/uploads/2021/11/ScreenShot-2021-11-25-9.33.23-300x40.png 300w" sizes="(max-width: 566px) 100vw, 566px" /></p>
<p>&nbsp;</p>
<p>ログランク検定でのP値は0.092に対して、Cox比例ハザードモデルのP値は0.09577です。</p>
<p>若干ではありますが、違いますよね。</p>
<p>これは両者の解析手法が異なるために起こることです。</p>
<p>ログランク検定は<a href="https://best-biostatistics.com/hypo_test/para.html">ノンパラメトリック検定</a>の一つであるのに対して、<a href="https://best-biostatistics.com/surviv/hirei-hazard.html">Cox比例ハザードモデルは「比例ハザード性」を仮定した解析</a>だからです。</p>
<p>&nbsp;</p>
<p><strong>「じゃあどっちのP値を使えばいいの！！？？？」</strong>と思いますよね。</p>
<p>これは、<span class="marker"><strong>事前にどっちを使うか決めておく必要があります</strong></span>。</p>
<p>論文で多いのは、結果のP値はログランク検定で評価し、ハザード比を推定するためだけにCox比例ハザードモデルを使う、という記載です。</p>
<p>つまり、<span class="marker"><strong>ログランク検定のP値を採用して、Cox比例ハザードモデルのP値は採用しない</strong></span>、というスタンス。</p>
<p>これはどっちが良い悪いという話ではないため、研究目的に応じて、研究者自身が決める必要があるのです。</p>
<p>&nbsp;</p>
<h2>まとめ</h2>
<p><img decoding="async" class="alignnone size-full wp-image-5331" src="https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_101008656-scaled-e1637541296894.jpeg" alt="" width="2560" height="1164" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_101008656-scaled-e1637541296894.jpeg 2560w, https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_101008656-scaled-e1637541296894-300x136.jpeg 300w, https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_101008656-scaled-e1637541296894-1024x466.jpeg 1024w, https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_101008656-scaled-e1637541296894-768x349.jpeg 768w, https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_101008656-scaled-e1637541296894-1536x698.jpeg 1536w, https://best-biostatistics.com/wp/wp-content/uploads/2021/11/AdobeStock_101008656-scaled-e1637541296894-2048x931.jpeg 2048w" sizes="(max-width: 2560px) 100vw, 2560px" /></p>
<p>いかがでしたか？</p>
<p>この記事は「ハザード比とはリスク比とどう違う？ログランク検定では出力できないけどどうすれば良い？」ということでお伝えしました。</p>
<p>&nbsp;</p>
<ul>
<li><strong>ハザード比ってそもそもどんな指標なの？</strong></li>
<li><strong>ハザード比はリスク比やオッズ比とどう違う？</strong></li>
<li><strong>ログランク検定ではハザード比が出ないんだけどどうすれば良い？</strong></li>
</ul>
<p>&nbsp;</p>
<p>といったことが理解できたのなら幸いです！</p>
<p>&nbsp;</p>
<p>こちらの内容は動画でも解説しておりますので、併せてご覧くださいませ。</p>
<p><iframe title="ハザード比とはどんな指標？" width="500" height="281" src="https://www.youtube.com/embed/YSttghg2l9s?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe></p>
]]></content:encoded>
					
					<wfw:commentRss>https://best-biostatistics.com/surviv/hazard-ratio.html/feed</wfw:commentRss>
			<slash:comments>0</slash:comments>
		
		
			</item>
		<item>
		<title>時間依存性共変量を考慮したCox比例ハザードモデルとは？EZRでの実施例も解説！</title>
		<link>https://best-biostatistics.com/surviv/time-dependent-cox.html</link>
					<comments>https://best-biostatistics.com/surviv/time-dependent-cox.html#respond</comments>
		
		<dc:creator><![CDATA[beat1115]]></dc:creator>
		<pubDate>Wed, 16 Aug 2023 03:03:42 +0000</pubDate>
				<category><![CDATA[わかりやすい生存時間解析]]></category>
		<guid isPermaLink="false">https://best-biostatistics.com/?p=6451</guid>

					<description><![CDATA[<p><img src="https://best-biostatistics.com/wp/wp-content/uploads/2023/08/Youtubeアイキャッチ-8-1024x576.jpg" class="webfeedsFeaturedVisual" /></p>この記事では「時間依存性共変量を考慮したCox比例ハザードモデルとは？EZRでの実施例も解説！」としてわかりやすく解説します。 時間依存性共変量とは？どんな例がある？ 時間依存性共変量を考慮したCox比例ハザードモデルの [&#8230;]]]></description>
										<content:encoded><![CDATA[<p><img src="https://best-biostatistics.com/wp/wp-content/uploads/2023/08/Youtubeアイキャッチ-8-1024x576.jpg" class="webfeedsFeaturedVisual" /></p><p>この記事では「時間依存性共変量を考慮したCox比例ハザードモデルとは？EZRでの実施例も解説！」としてわかりやすく解説します。</p>
<ul>
<li>時間依存性共変量とは？どんな例がある？</li>
<li>時間依存性共変量を考慮したCox比例ハザードモデルの例</li>
<li>時間依存性共変量を考慮したCox比例ハザードモデルをEZRで実施する</li>
</ul>
<p>理解できるようになります。</p>
<p>ぜひご覧くださいませ！</p>
<p>&nbsp;</p>
<h2>時間依存性共変量とは？どんな例がある？</h2>
<p><img decoding="async" class="size-full wp-image-6452" src="https://best-biostatistics.com/wp/wp-content/uploads/2023/08/AdobeStock_210736855-scaled.jpeg" alt="" width="2560" height="1280" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2023/08/AdobeStock_210736855-scaled.jpeg 2560w, https://best-biostatistics.com/wp/wp-content/uploads/2023/08/AdobeStock_210736855-300x150.jpeg 300w, https://best-biostatistics.com/wp/wp-content/uploads/2023/08/AdobeStock_210736855-1024x512.jpeg 1024w, https://best-biostatistics.com/wp/wp-content/uploads/2023/08/AdobeStock_210736855-768x384.jpeg 768w, https://best-biostatistics.com/wp/wp-content/uploads/2023/08/AdobeStock_210736855-1536x768.jpeg 1536w, https://best-biostatistics.com/wp/wp-content/uploads/2023/08/AdobeStock_210736855-2048x1024.jpeg 2048w" sizes="(max-width: 2560px) 100vw, 2560px" /></p>
<p>時間依存性共変量を理解する前に、まずは通常の共変量に関して整理しましょう！</p>
<p>&nbsp;</p>
<h3>通常の共変量はどんな前提を持っている？</h3>
<p>通常、<a href="https://best-biostatistics.com/correlation_regression/variables.html">共変量（説明変数）</a>というのは、背景因子の何かであることが一般的ですね。</p>
<p>その共変量に関して、どんな前提を持っているかというと、以下の3つのうちどれか。</p>
<p>&nbsp;</p>
<ol>
<li>ベースライン（研究開始時点）から変わらない前提</li>
<li>変わったとしても、全員一律変わる</li>
<li>変わったとしてもランダムに発生するから、群間比較の上では無視可能</li>
</ol>
<p>&nbsp;</p>
<p>1つ目の「ベースライン（研究開始時点）から変わらない前提」ですが、これは例えば性別や成人における身長。</p>
<p>性別は研究期間中に変わることは考えられませんし、成人であれば身長が大幅に伸びるということも考えられません。</p>
<p>&nbsp;</p>
<p>2つ目の「変わったとしても、全員一律変わる」に関しては、例えば年齢。</p>
<p>どんな人でも1年で1歳分だけ歳をとりますので、それなら共変量としては特に考える必要はありません。</p>
<p>&nbsp;</p>
<p>3つ目の「変わったとしてもランダムに発生するから、群間比較の上では無視可能」というのは、例えば体重や血圧の増減。</p>
<p>例えば研究の期間が1年だったとして、1年もあれば体重や血圧は変動する可能性はあります。</p>
<p>しかし、それは群間で偏った増減ではなく、どの群でもランダムに起こりうる増減であれば、群間比較をする上では無視可能。</p>
<p>だから、ベースラインの1点のみ考えればOK、という考え方です。</p>
<p>&nbsp;</p>
<h3>時間依存性の共変量とは？</h3>
<p>では時間依存性の共変量とはどんなものでしょうか。</p>
<p>それは、通常の共変量の考え方がどうしてもできない共変量のこと。</p>
<p>つまり、<span class="marker"><strong>「研究期間中に全員が一律変化するわけではない」し「ランダムに変わるわけではなく、その変化がアウトカムに著しく影響を及ぼす」</strong></span>という共変量です。</p>
<p>一言で言えば「アウトカムに影響を与える因子が時間とともに変化する」時に、その因子は時間依存性の共変量といえます。</p>
<p>&nbsp;</p>
<p>後述する論文では、「ニルマトレルビル治療を受けたかどうか」というのが時間依存的に変化し、その変化を解析上考慮したい、という目的を持っています。</p>
<p><img decoding="async" class="alignnone size-full wp-image-6453" src="https://best-biostatistics.com/wp/wp-content/uploads/2023/08/ScreenShot-2023-08-14-9.23.34.png" alt="" width="1316" height="791" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2023/08/ScreenShot-2023-08-14-9.23.34.png 1316w, https://best-biostatistics.com/wp/wp-content/uploads/2023/08/ScreenShot-2023-08-14-9.23.34-300x180.png 300w, https://best-biostatistics.com/wp/wp-content/uploads/2023/08/ScreenShot-2023-08-14-9.23.34-1024x615.png 1024w, https://best-biostatistics.com/wp/wp-content/uploads/2023/08/ScreenShot-2023-08-14-9.23.34-768x462.png 768w" sizes="(max-width: 1316px) 100vw, 1316px" /></p>
<p>&nbsp;</p>
<h2>時間依存性共変量を考慮したCox比例ハザードモデルの例</h2>
<p>では、実際に時間依存性共変量を考慮したCox比例ハザードモデルの例を見てみましょう。</p>
<p>こちらの論文では、時間依存性共変量を考慮したCox比例ハザードモデルが使われています。</p>
<p><img decoding="async" class="alignnone size-full wp-image-6454" src="https://best-biostatistics.com/wp/wp-content/uploads/2023/08/ScreenShot-2023-08-14-11.57.43.png" alt="" width="1459" height="567" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2023/08/ScreenShot-2023-08-14-11.57.43.png 1459w, https://best-biostatistics.com/wp/wp-content/uploads/2023/08/ScreenShot-2023-08-14-11.57.43-300x117.png 300w, https://best-biostatistics.com/wp/wp-content/uploads/2023/08/ScreenShot-2023-08-14-11.57.43-1024x398.png 1024w, https://best-biostatistics.com/wp/wp-content/uploads/2023/08/ScreenShot-2023-08-14-11.57.43-768x298.png 768w" sizes="(max-width: 1459px) 100vw, 1459px" /></p>
<p>（引用：https://www.nejm.org/doi/full/10.1056/NEJMoa2204919）</p>
<p>&nbsp;</p>
<p>下記の通り、ニルマトレルビル治療の有無が研究期間中に変化してしまう状況、ということです。</p>
<p><img decoding="async" class="alignnone size-full wp-image-6453" src="https://best-biostatistics.com/wp/wp-content/uploads/2023/08/ScreenShot-2023-08-14-9.23.34.png" alt="" width="1316" height="791" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2023/08/ScreenShot-2023-08-14-9.23.34.png 1316w, https://best-biostatistics.com/wp/wp-content/uploads/2023/08/ScreenShot-2023-08-14-9.23.34-300x180.png 300w, https://best-biostatistics.com/wp/wp-content/uploads/2023/08/ScreenShot-2023-08-14-9.23.34-1024x615.png 1024w, https://best-biostatistics.com/wp/wp-content/uploads/2023/08/ScreenShot-2023-08-14-9.23.34-768x462.png 768w" sizes="(max-width: 1316px) 100vw, 1316px" /></p>
<p>結果の解釈などは原著を見ていただければと思いますが、通常の<a href="https://best-biostatistics.com/surviv/cox.html">Cox比例ハザードモデル</a>の解釈の仕方で問題ありません。</p>
<p>&nbsp;</p>
<h2>時間依存性共変量を考慮したCox比例ハザードモデルをEZRで実施する</h2>
<p>では最後に、時間依存性共変量を考慮したCox比例ハザードモデルをEZRで実施する方法をお伝えします。</p>
<p>どこで実施できるかというと、<span style="text-decoration: underline;"><strong>「統計解析　＞　生存期間の解析　＞時間依存性変数を含む生存期間に対する多変量解析（Cox比例ハザード回帰）」</strong></span>です。</p>
<p><img decoding="async" class="alignnone size-full wp-image-6455" src="https://best-biostatistics.com/wp/wp-content/uploads/2023/08/ScreenShot-2023-08-14-12.04.48.png" alt="" width="713" height="344" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2023/08/ScreenShot-2023-08-14-12.04.48.png 713w, https://best-biostatistics.com/wp/wp-content/uploads/2023/08/ScreenShot-2023-08-14-12.04.48-300x145.png 300w" sizes="(max-width: 713px) 100vw, 713px" /></p>
<p>解析をする上で、通常の<a href="https://best-biostatistics.com/ezr/cox-reg.html">Cox比例ハザードモデルをEZRで実施する場合</a>と同じ点と異なる点を把握しておきましょう。</p>
<p><img decoding="async" class="alignnone size-full wp-image-6456" src="https://best-biostatistics.com/wp/wp-content/uploads/2023/08/時間依存性変数を含む生存期間に対する多変量解析_Cox比例ハザード回帰_.jpg" alt="" width="744" height="783" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2023/08/時間依存性変数を含む生存期間に対する多変量解析_Cox比例ハザード回帰_.jpg 744w, https://best-biostatistics.com/wp/wp-content/uploads/2023/08/時間依存性変数を含む生存期間に対する多変量解析_Cox比例ハザード回帰_-285x300.jpg 285w" sizes="(max-width: 744px) 100vw, 744px" /></p>
<p>青で囲んだ部分は、通常の<a href="https://best-biostatistics.com/ezr/cox-reg.html">Cox比例ハザードモデルをEZRで実施する場合</a>と同じ点です。</p>
<p>一方で、赤で囲んだ部分が、時間依存性共変量を考慮したCox比例ハザードモデルで独特の指定場所になります。</p>
<p>&nbsp;</p>
<h3>EZRで時間依存性共変量を考慮したCox比例ハザードモデルを実施するためのデータの作りかた</h3>
<p>じゃあこの赤で囲んだ部分を指定するには、<span style="color: #ff0000;"><strong>データの中に「時間依存性変数が変わるまでの時間」を追加する必要がある</strong></span>ということです。</p>
<p>ここからは書籍「EZRでやさしく学ぶ医療統計」に付与されるデモデータを用いて解説するのですが、下記の図の通り「時間依存性変数が変わるまでの時間」をデータに付与します。</p>
<p><img decoding="async" class="alignnone size-full wp-image-6457" src="https://best-biostatistics.com/wp/wp-content/uploads/2023/08/ScreenShot-2023-08-14-15.03.37.jpg" alt="" width="2170" height="1118" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2023/08/ScreenShot-2023-08-14-15.03.37.jpg 2170w, https://best-biostatistics.com/wp/wp-content/uploads/2023/08/ScreenShot-2023-08-14-15.03.37-300x155.jpg 300w, https://best-biostatistics.com/wp/wp-content/uploads/2023/08/ScreenShot-2023-08-14-15.03.37-1024x528.jpg 1024w, https://best-biostatistics.com/wp/wp-content/uploads/2023/08/ScreenShot-2023-08-14-15.03.37-768x396.jpg 768w, https://best-biostatistics.com/wp/wp-content/uploads/2023/08/ScreenShot-2023-08-14-15.03.37-1536x791.jpg 1536w, https://best-biostatistics.com/wp/wp-content/uploads/2023/08/ScreenShot-2023-08-14-15.03.37-2048x1055.jpg 2048w" sizes="(max-width: 2170px) 100vw, 2170px" /></p>
<p>実際のデータを見ると、下記の通り。</p>
<p>DaysHCが「イベントまでの時間」ですが、それの他にDaysGVHD24という「時間依存性変数が変わるまでの時間」がデータに付与されていることがわかります。</p>
<p><img decoding="async" class="alignnone size-full wp-image-6458" src="https://best-biostatistics.com/wp/wp-content/uploads/2023/08/HCafterSCT_と_R_コマンダー.jpg" alt="" width="862" height="702" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2023/08/HCafterSCT_と_R_コマンダー.jpg 862w, https://best-biostatistics.com/wp/wp-content/uploads/2023/08/HCafterSCT_と_R_コマンダー-300x244.jpg 300w, https://best-biostatistics.com/wp/wp-content/uploads/2023/08/HCafterSCT_と_R_コマンダー-768x625.jpg 768w" sizes="(max-width: 862px) 100vw, 862px" /></p>
<p>時間依存性変数が研究期間中に変わる場合には「イベントまでの時間」と「時間依存性変数が変わるまでの時間」が異なりますが、時間依存性変数が変わらない症例は二つの時間は一致します。</p>
<p>&nbsp;</p>
<h3>実際にEZRで時間依存性共変量を考慮したCox比例ハザードモデルを実施する</h3>
<p>ではデータが用意できたら、解析を実施します。</p>
<p><span style="text-decoration: underline;"><strong>「統計解析　＞　生存期間の解析　＞時間依存性変数を含む生存期間に対する多変量解析（Cox比例ハザード回帰）」</strong></span>を選択。</p>
<p><img decoding="async" class="alignnone size-full wp-image-6455" src="https://best-biostatistics.com/wp/wp-content/uploads/2023/08/ScreenShot-2023-08-14-12.04.48.png" alt="" width="713" height="344" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2023/08/ScreenShot-2023-08-14-12.04.48.png 713w, https://best-biostatistics.com/wp/wp-content/uploads/2023/08/ScreenShot-2023-08-14-12.04.48-300x145.png 300w" sizes="(max-width: 713px) 100vw, 713px" /></p>
<p>下記の通り、上の部分にはイベントの有無と、イベントまでの時間を指定します。</p>
<p>そして、時間依存性変数が変わるまでの時間を、下の方で指定します。</p>
<p><img decoding="async" class="alignnone size-full wp-image-6459" src="https://best-biostatistics.com/wp/wp-content/uploads/2023/08/時間依存性変数を含む生存期間に対する多変量解析_Cox比例ハザード回帰__と_R_コマンダー.jpg" alt="" width="755" height="792" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2023/08/時間依存性変数を含む生存期間に対する多変量解析_Cox比例ハザード回帰__と_R_コマンダー.jpg 755w, https://best-biostatistics.com/wp/wp-content/uploads/2023/08/時間依存性変数を含む生存期間に対する多変量解析_Cox比例ハザード回帰__と_R_コマンダー-286x300.jpg 286w" sizes="(max-width: 755px) 100vw, 755px" /></p>
<p>この状態でOKを押すと、解析結果が出力されます。</p>
<p><img decoding="async" class="alignnone size-full wp-image-6460" src="https://best-biostatistics.com/wp/wp-content/uploads/2023/08/ScreenShot-2023-08-14-15.08.38.png" alt="" width="1102" height="160" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2023/08/ScreenShot-2023-08-14-15.08.38.png 1102w, https://best-biostatistics.com/wp/wp-content/uploads/2023/08/ScreenShot-2023-08-14-15.08.38-300x44.png 300w, https://best-biostatistics.com/wp/wp-content/uploads/2023/08/ScreenShot-2023-08-14-15.08.38-1024x149.png 1024w, https://best-biostatistics.com/wp/wp-content/uploads/2023/08/ScreenShot-2023-08-14-15.08.38-768x112.png 768w" sizes="(max-width: 1102px) 100vw, 1102px" /></p>
<p>この結果から、急性移植片対宿主病（GVHD）なしより、急性移植片対宿主病（GVHD）ありの方が イベント（出血性膀胱炎）が発症しやすい、ということが言えます。</p>
<p>&nbsp;</p>
<h3>EZRで時間依存性共変量を考慮したCox比例ハザードモデルを実施した時にEZRが解析プロセスでやっていること</h3>
<p>上記の通り、EZRを用いることで、簡単に時間依存性共変量を考慮したCox比例ハザードモデルを実施することができました。</p>
<p>でも、解析のプロセスがちょっとブラックボックスな感じがして「本当に大丈夫？」という、何となくのモヤモヤがある方もいるかもしれません。</p>
<p>そのため、ここからはEZRが解析プロセスの中でやっていることを解説しますね。</p>
<p>&nbsp;</p>
<p>実は、時間依存性変数を含む生存期間に対する多変量解析（Cox比例ハザード回帰）を実施するとTempTDというデータが作られることがわかります。</p>
<p>そのTempTDを見てみると、以下のように時間依存性の共変量が変わった症例は、2行になっていることがわかります。</p>
<p>そして、新たに「Start日（変数名：start_td）」「Stop日（変数名：stop_td）」「共変量が0か1か（変数名：DaysGVHD24_td）」という3つの変数が作成されていることがわかります。</p>
<p><img decoding="async" class="alignnone size-full wp-image-6461" src="https://best-biostatistics.com/wp/wp-content/uploads/2023/08/TempTD.jpg" alt="" width="1374" height="754" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2023/08/TempTD.jpg 1374w, https://best-biostatistics.com/wp/wp-content/uploads/2023/08/TempTD-300x165.jpg 300w, https://best-biostatistics.com/wp/wp-content/uploads/2023/08/TempTD-1024x562.jpg 1024w, https://best-biostatistics.com/wp/wp-content/uploads/2023/08/TempTD-768x421.jpg 768w" sizes="(max-width: 1374px) 100vw, 1374px" /></p>
<p>そして、EZRの出力でRのプログラムを見ると、Start日とStop日を考慮してCox回帰を実施していることがわかります。</p>
<p>そして、説明変数には新たに作成された「共変量が0か1か（変数名：DaysGVHD24_td）」が指定されています。</p>
<p><img decoding="async" class="alignnone size-full wp-image-6462" src="https://best-biostatistics.com/wp/wp-content/uploads/2023/08/R_コマンダー.jpg" alt="" width="1816" height="412" srcset="https://best-biostatistics.com/wp/wp-content/uploads/2023/08/R_コマンダー.jpg 1816w, https://best-biostatistics.com/wp/wp-content/uploads/2023/08/R_コマンダー-300x68.jpg 300w, https://best-biostatistics.com/wp/wp-content/uploads/2023/08/R_コマンダー-1024x232.jpg 1024w, https://best-biostatistics.com/wp/wp-content/uploads/2023/08/R_コマンダー-768x174.jpg 768w, https://best-biostatistics.com/wp/wp-content/uploads/2023/08/R_コマンダー-1536x348.jpg 1536w" sizes="(max-width: 1816px) 100vw, 1816px" /></p>
<p>そのため、EZRでは解析プロセスとして「Start日（変数名：start_td）」「Stop日（変数名：stop_td）」「共変量が0か1か（変数名：DaysGVHD24_td）」という3つの変数を作成し、これらを考慮してCox回帰を実施していることがわかります。</p>
<p>&nbsp;</p>
<h2>まとめ</h2>
<p>いかがでしたか？</p>
<p>この記事では「時間依存性共変量を考慮したCox比例ハザードモデルとは？EZRでの実施例も解説！」としてわかりやすく解説しました。</p>
<ul>
<li>時間依存性共変量とは？どんな例がある？</li>
<li>時間依存性共変量を考慮したCox比例ハザードモデルの例</li>
<li>時間依存性共変量を考慮したCox比例ハザードモデルをEZRで実施する</li>
</ul>
<p>を理解していただけたのなら嬉しいです！</p>
<p>&nbsp;</p>
<p>こちらの内容は動画でも解説しておりますので、併せてご確認くださいませ。</p>
<p><iframe title="時間依存性共変量を考慮したCox比例ハザードモデルとは？EZRでの実施例も解説！" width="500" height="281" src="https://www.youtube.com/embed/lr1rN2hSCLg?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen></iframe></p>
]]></content:encoded>
					
					<wfw:commentRss>https://best-biostatistics.com/surviv/time-dependent-cox.html/feed</wfw:commentRss>
			<slash:comments>0</slash:comments>
		
		
			</item>
	</channel>
</rss>
