EZRでCox比例ハザードモデルを実施する方法!単変量解析するとどうなる?

今回の記事では、EZRで多変量解析の一つであるCox比例ハザードモデルを実施する具体的な手順をお伝えします。

実際のデータを解析する際には、T検定やカイ二乗検定などの単純な検定だけでなく、共変量を調整するような多変量解析を多く実施することがありますよね。

そのため、今回の記事がそのままあなたの実務に役立つと思います。

この記事では、EZRを用いて多変量解析の一つである、Cox比例ハザードモデルを実施します。

Cox比例ハザードモデルは、応答変数(目的変数)が生存時間データである場合に使える解析手法です。

では、いってみましょう!

>>もう統計で悩むのは終わりにしませんか? 

↑期間・数量限定で無料プレゼント中!

目次

EZRでCox比例ハザードモデルを実施するにはどんな状況であればいい?

まず重要なのが、あなたの手元にあるデータでどの種類の回帰分析を実施するのか!?ということ。

これを知らなければ、実務でデータを解析することができませんよね。

 

どの回帰分析を実施するのか、という判断は、実は簡単です。

目的変数がどんな種類のデータなのか、ということを考えればいいだけ

 

  • 目的変数が連続量:共分散分析(重回帰分析)
  • 目的変数が2値データ(カテゴリカルデータ):ロジスティック回帰分析
  • 目的変数が生存時間データ:Cox比例ハザードモデル

 

ということなので、Cox比例ハザードモデルを実施するには目的変数が生存時間データであることが必要だと理解できました。

では早速、EZRでCox比例ハザードモデルを実践していきましょう!

 

EZRでCox比例ハザードモデルを実施する方法

EZRでCox比例ハザードモデルを実施します。

今回は自治医科大学さんが提供しているサンプルデータの中から「Survival」を使ってみます。

いぜん、EZRでカプランマイヤー曲線を作成した時のデータと同じです。

>>Survivalデータは、こちらからダウンロードできます。

 

「Age」「Sex」「Disease」「Treatment」「OS」「DaysToOS」「PS2.3.4」の7種類のデータがあります。

そのため、Age(年齢)が共変量だったと仮定して、“年齢という共変量の影響を取り除き、Treatmentごとに生存時間が変わるのか”ということをやります。

 

では実際にやっていきましょう!

 

EZRにCox比例ハザードモデルを実施するためのデータを取り込む

ではここから、EZRにデータを取り込みます。

まずは、サンプルデータを適切な場所に保存しておきましょう。

 

EZRを開き、「ファイル」→「データのインポート」→「ファイルまたはクリップボード, URLからテキストデータを読み込む」を選択します。

 

 

データセット名は「survival」にしましょう(実際はなんでもよいです)。

そして「ローカルファイルシステム」と「カンマ」にチェックを入れてOKを押します。

 

データセットが「survival」になっていることを確認し、「表示」を押してデータが正しく表示されれば取り込み完了です。

 

 

EZRでCox比例ハザードモデルを実行する!

解析するための準備が整いましたので、早速、Cox比例ハザードモデルを実施してみましょう。

Cox比例ハザードモデルを実施するには、以下の手順で行います。

 

「統計解析」→「生存期間の解析」→「生存期間に対する多変量解析(Cox比例ハザード回帰)」

 

 

  • 時間には「DaysToOS」を選択します。(変数をダブルクリックすることで選択できます。)
  • イベントには「OS」を選択します。(こちらもダブルクリックです。)
  • 説明変数には「Age」と「Treatment」を選択します。(こちらもダブルクリックです。)

他は、いじらなくてOKです。

 

 

これで解析を実行すると、以下の解析を自動で行ってくれます。

  • Cox比例ハザードモデルを実施した結果の表の作成
  • ハザード比とその95%信頼区間に関する表の作成

 

>>もう統計で悩むのは終わりにしませんか? 

↑1万人以上の医療従事者が購読中

EZRでのCox比例ハザードモデル結果の解釈をしよう

実際にCox比例ハザードモデルが実施できました。

では、結果の解釈をしていきましょう。

EZRで実施したCox比例ハザードモデルの結果を解釈する

まずはCox比例ハザードモデルを実施した結果の表の解析結果です。

かなりの情報量が詰まっていますね。

 

 

coxph(formula = Surv(DaysToOS, OS == 1) ~ Age + Treatment, data = survival,

method = “breslow”)

というのは、ざっくり言うと「Cox比例ハザードモデルでの解析を実施しましたよ」ということ。

そして、その回帰式が“Surv(生存期間がDaysToOS, イベントがOS)=Age+Treatment”ということですね。

解析の例数は74で、イベントは41あることも読み取れます。

 

重要なのが、イベントから下のこちらの部分。

 

ここには、説明変数で入れた「Age」と「Treatment」の結果が記載されています。

これはハザード比に関しての結果が出ているのですが、さらに下に出力されているハザード比の表の方が見やすいので、ここではちょっとスキップします。

 

ハザード比に関する表の解釈

次に、各説明変数のハザード比に関する結果が出力されています。

 

ハザード比の点推定値と95%信頼区間、そしてP値です。

 

ハザード比は1だった場合に「差がない」といえます。

そのため、1から遠ければ遠い点推定値であるほど、「差がある」ということが言えます。

 

ここからも、有意水準が0.05だった時に有意差があるかどうかわかります。

Ageは95%信頼区間が1を跨いでいないため、有意差あり。

Treatmentは95%信頼区間が1を跨いでいないため、有意差なし。

この95%信頼区間と有意差の関係は、一目見て理解できるようになっていたいですね。

 

Cox比例ハザードモデルを使って単変量解析するとどうなるの?

今回も共分散分析と同様に説明変数を2つ含め、共変量の影響を除いて群間比較しました。

今回のデータでは、Ageを共変量として多変量解析を実施していましたよね。

では、共変量がなかった時に本当に結果が変わるのか!?ということをやってみましょう

 

やり方の手順は先ほどと同じで、説明変数にはTreatmentの1つだけ入れます。

 

すると、下記のような結果が出力されています。

 

Ageで調整した場合にはP=0.6565でしたが、Ageで調整しないとP=0.09577という結果が出ました。

Ageによる調整の有無が、Treatmentの結果にかなり影響を与えていたことが分かります。

 

まとめ

今回は、EZRで多変量解析の一つであるCox比例ハザードモデルを実施しました。

これを実践し、結果の解釈をすることができれば、必ず実務で役に立ちます。

>>ログランク検定と一般化ウィルコクソン検定とは?

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

リサーチクエスチョン探し?データ分析?論文投稿?、、、で、もう悩まない!

第1章臨床研究ではなぜ統計が必要なのか?計画することの重要性
  • 推定ってどんなことをしているの?
  • 臨床研究を計画するってどういうこと?
  • どうにかして標本平均を母平均に近づけられないか?
第2章:研究目的をどれだけ明確にできるのかが重要
  • データさえあれば解析でどうにかなる、という考え方は間違い
  • 何を明らかにしたいのか? という研究目的が重要
  • 研究目的は4種類に分けられる
  • 統計専門家に相談する上でも研究目的とPICOを明確化しておく
第3章:p値で結果が左右される時代は終わりました
  • アメリカ統計協会(ASA)のp値に関する声明で指摘されていること
  • そうは言っても、本当に有意差がなくてもいいの…?
  • なぜ統計専門家はp値を重要視していないのか
  • 有意差がない時に「有意な傾向があった」といってもいい?
  • 統計を放置してしまうと非常にまずい
第4章:多くの人が統計を苦手にする理由
  • 残念ながら、セミナー受講だけで統計は使えません。
  • インプットだけで統計が使えない理由
  • どうやったら統計の判断力が鍛えられるか?
  • 統計は手段なので正解がないため、最適解を判断する力が必要
第5章:統計を使えるようになるために今日から何をすれば良いか?
  • 論文を読んで統計が使えるようになるための5ステップ
第6章:統計を学ぶために重要な環境
  • 統計の3つの力をバランスよく構築する環境

以下のボタンをクリックして、画面に出てくる指示に従って、必要事項を記入してください。

コメント

コメント一覧 (1件)

コメントする

目次