EZRで多変量解析!共分散分析(重回帰分析)を実施する方法

EZRで多変量解析!共分散分析(重回帰分析)を実施する方法

この記事では、EZRで多変量解析の一つである共分散分析(重回帰分析)を実施する具体的な手順をお伝えします。

実際のデータを解析する際には、T検定やカイ二乗検定などの単純な検定だけでなく、共変量を調整するような多変量解析を多く実施することがありますよね。

そのため、今回の記事がそのままあなたの実務に役立つと思います。

 

共分散分析に関しての基礎知識はこちらの記事をご参照くださいね。

>>共分散分析に関して深く理解する!

では、いってみましょう!

 

>>もう統計で悩むのは終わりにしませんか? 

↑1万人以上の医療従事者が購読中

目次

EZRでどんな多変量解析をすればいいかってどう判断するの?

まず重要なのが、あなたの手元にあるデータでどの多変量解析を実施するのか!?ということ。

これを知らなければ、実務でデータを解析することができませんよね。

 

どの多変量を実施するのか、という判断は、実は簡単です。

目的変数がどんな種類のデータなのか、ということを考えればいいだけ。

 

  • 目的変数が連続量:共分散分析(重回帰分析)
  • 目的変数が2値データ(カテゴリカルデータ):ロジスティック回帰
  • 目的変数が生存時間データ:Cox比例ハザードモデル

 

ここで共分散分析(重回帰分析)としているのは、実際には共分散分析と重回帰分析のやり方は一緒だからです。

共分散分析も重回帰分析も、目的変数が連続量であることは同じ

説明変数にカテゴリカルデータがあるかどうかで呼び方を変えているだけです。

ということなので、この記事では共分散分析(重回帰分析)として区別せずに説明していきます。

 

そのため、共分散分析(重回帰分析)を実施するには目的変数が連続量であることが必要だと理解できました。

では早速、EZRで共分散分析(重回帰分析)を実践していきましょう!

 

EZRで共分散分析(重回帰分析)を実施する!

EZRで共分散分析(重回帰分析)を実施します。

共分散分析とは、共変量の影響を除いて群間比較できる、解析手法でした。

>>共分散分析を詳しく理解する!

 

そして今回は自治医科大学さんが提供しているサンプルデータの中から「Hb」を使ってみます。

「Hospital」「Sex」「Hb」の3種類のデータがあります。

そのため、性別が共変量だったと仮定して、“性別という共変量の影響を取り除いた病院AとBのHbの値の違いを比較する”ということをやります

 

では実際にやっていきましょう!

 

EZRに共分散分析(重回帰分析)を実施するためのデータを取り込む

ではここから、EZRにデータを取り込みます。

まずは、サンプルデータを適切な場所に保存しておきましょう。

 

EZRを開き、「ファイル」→「データのインポート」→「ファイルまたはクリップボード, URLからテキストデータを読み込む」を選択します。

 

 

データセット名は「Hb」にしましょう(実際はなんでもよい)。

そして「ローカルファイルシステム」と「カンマ」にチェックを入れてOKを押します。

データセットが「Hb」になっていることを確認し、「表示」を押してデータが正しく表示されれば取り込み完了です。

 

EZRで共分散分析を実践する!

解析するための準備が整いましたので、早速、共分散分析を実施してみましょう。

共分散分析を実施するには、以下の手順で行います。

 

「統計解析」→「連続変数の解析」→「線形回帰(単回帰、重回帰)」

 

 

  • 目的変数(1つ選択)で「Hb」を選択します。
  • 説明変数(1つ以上選択)で「Hospital」と「Sex」を選択します。(複数選択の際にはCtrlを押しながらクリックします)
  • 他は、いじらなくてOKです。

 

 

これで解析を実行すると、以下の解析を自動で行ってくれます。

  • 共分散分析(重回帰分析)を実施した結果の表の作成
  • 回帰係数に関する表の作成

 

>>もう統計で悩むのは終わりにしませんか? 

↑1万人以上の医療従事者が購読中

共分散分析(重回帰分析)の解釈をしよう

実際に共分散分析が実施できました。

では、結果の解釈をしていきましょう。

 

共分散分析表の結果解釈

まずは共分散分析を実施した結果の表の解析結果です。

かなりの情報量が詰まっていますね。

 

 

lm(formula = Hb ~ Hospital + Sex, data = ancova)

というのは、Linear Model(線形回帰)を実施したということです。

そして、その回帰式が“Hb=Hospital+Sex”ということですね。

 

Residuals:には、残差に関する情報が載っています。

ここは特に解釈することはないので、スキップで。

 

重要なのが、Coeffifients:の部分です。

ここには、説明変数で入れた「Hospital」と「Sex」の回帰係数の結果が記載されています。

>>回帰係数に関しては、こちらで深く理解しましょう!

 

ここの結果で重要なのが「Estimate」と「Pr(>|t|)」の二つ

Estimateは、回帰係数の点推定値です。

Pr(>|t|)は、“回帰係数が0である”という帰無仮説に対する検定結果です。

つまりここのP値が0.05を下回った場合に、回帰係数は0ではなさそうだ、ということが言えます。

更に言い換えると、P値が0.05を下回った場合には“この説明変数は目的変数に対して影響を与えていそうだ”ということが言えます。

 

今回の結果でいうと、HospitalはP=0.0745なので有意水準5%で有意差なし。

性別は有意差あり、です。

 

今回知りたかったことは、性別が共変量だったと仮定して、“性別という共変量の影響を取り除いた病院AとBのHbの値の違いを比較する”ということです。

今回の結果から、Hbの値に関して性別の影響を除いて病院AとBを比較したら、有意差はなかった、という結論を導くことができます

 

そして最後に一番下を見てみます。

ここで重要なのは、自由度について

統計検定2級でも、回帰分析の結果から自由度を読み取らせる問題が頻出するので、ぜひとも見方を覚えましょう。

今回は、説明変数で自由度が2、残差(Residual)で26と読み取れます。

ここからも、データ数は2+26+1=29であることが分かりますね。

>>自由度に関しては、こちらで深く理解しましょう!

 

 

共分散分析(重回帰分析)での回帰係数に関する表の解釈

その次に、回帰係数に関する表が出力されています。

主に回帰係数の点推定値と95%信頼区間ですね。

ここでの95%信頼区間は、一般的な95%信頼区間と、解釈の仕方は一緒です。

>>95%信頼区間を深く理解する!

 

 

ここからも、有意水準が0.05だった時に有意差があるかどうかわかります。

Hosppitalは95%信頼区間が0を跨いでいるため、有意差なし。

Sexは95%信頼区間が0を跨いでいないため、有意差あり。

この95%信頼区間と有意差の関係は、一目見て理解できるようになっていたいですね。

 

共分散分析(重回帰分析)じゃなく、共変量で調整しない解析をするとどう違いが出てくるの?

共分散分析は、共変量の影響を除いて群間比較できる、解析手法でした。

今回のデータでは、Sexを共変量としていましたよね。

では、共変量がなかった時に本当に結果が変わるのか!?ということをやってみましょう。

 

やり方の手順は先ほどと同じで、説明変数にはHospitalの1つだけ入れます。

 

 

すると、下記のような結果が出力されています。

 

 

Sexで調整した場合にはP=0.0745でしたが、Sexで調整しないとP=0.378という結果が出ました。

Sexによる調整の有無が、Hosppitalの結果に影響を少なからず与えていたことが分かります。

 

まとめ

いかがでしたか?

今回は、EZRで多変量解析の一つである共分散分析を実施しました。

これを実践し、結果の解釈をすることができれば、必ず実務で役に立ちますので、繰り返し実践してみてくださいね!

 

EZRで共分散分析(ANCOVA)を実施する方法は、動画でもお伝えしていますので併せてご確認くださいませ。

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

リサーチクエスチョン探し?データ分析?論文投稿?、、、で、もう悩まない!

第1章臨床研究ではなぜ統計が必要なのか?計画することの重要性
  • 推定ってどんなことをしているの?
  • 臨床研究を計画するってどういうこと?
  • どうにかして標本平均を母平均に近づけられないか?
第2章:研究目的をどれだけ明確にできるのかが重要
  • データさえあれば解析でどうにかなる、という考え方は間違い
  • 何を明らかにしたいのか? という研究目的が重要
  • 研究目的は4種類に分けられる
  • 統計専門家に相談する上でも研究目的とPICOを明確化しておく
第3章:p値で結果が左右される時代は終わりました
  • アメリカ統計協会(ASA)のp値に関する声明で指摘されていること
  • そうは言っても、本当に有意差がなくてもいいの…?
  • なぜ統計専門家はp値を重要視していないのか
  • 有意差がない時に「有意な傾向があった」といってもいい?
  • 統計を放置してしまうと非常にまずい
第4章:多くの人が統計を苦手にする理由
  • 残念ながら、セミナー受講だけで統計は使えません。
  • インプットだけで統計が使えない理由
  • どうやったら統計の判断力が鍛えられるか?
  • 統計は手段なので正解がないため、最適解を判断する力が必要
第5章:統計を使えるようになるために今日から何をすれば良いか?
  • 論文を読んで統計が使えるようになるための5ステップ
第6章:統計を学ぶために重要な環境
  • 統計の3つの力をバランスよく構築する環境

以下のボタンをクリックして、画面に出てくる指示に従って、必要事項を記入してください。

コメント

コメント一覧 (1件)

コメントする

目次