相関と回帰分析

多変量解析は医学研究でどう使われる?使い分けを実例を踏まえて解説

この記事では「多変量解析は医学研究でどう使われる?使い分けを実例を踏まえて解説」としてお伝えします。

医学研究をしていると、多変量解析の知識は必須です。

でも、多変量解析ってなぜ使われているのか、そしてどんな時に使う必要があるのか、というのが疑問になりますよね。

そのため本記事では

  • 多変量解析とは?単変量解析との違い
  • 多変量解析が医学研究でどんな時に使われるか実例を踏まえて解説
  • 多変量解析のモデルの妥当性に関する使い分け

についてわかりやすく解説します!

>>もう統計で悩むのは終わりにしませんか? 

↑期間・数量限定で無料プレゼント中!

多変量解析とは?単変量解析との違い

まず、多変量解析と単変量解析の違いについて整理しましょう。

多変量解析と単変量解析の違いはそれほど難しくありません。

  • 多変量解析:回帰分析の中で説明変数を複数(2つ以上)含めた解析
  • 単変量解析:説明変数が1つだけの解析

これだけの違いです。

つまり、回帰分析において説明変数が1つだけだったら単変量解析ですし、説明変数が2つ以上あれば多変量解析ということ。

 

回帰分析はアウトカムのデータの種類に応じて「ロジスティック回帰」だったり「Cox回帰」だったりと分類されますが、ロジスティック回帰でも説明変数が1つなら「単変量ロジスティック回帰(つまり単変量解析)」ですし、説明変数が2つ以上なら「多変量ロジスティック回帰分析(つまり多変量解析)」になります。

同様に、Cox回帰でも説明変数が1つなら「単変量Cox回帰(つまり単変量解析)」ですし、説明変数が2つ以上なら「多変量Cox回帰分析(つまり多変量解析)」になります。

どんな回帰分析の種類であっても、説明変数が1つだけだったら単変量解析ですし、説明変数が2つ以上あれば多変量解析ということです。

 

多変量解析が医学研究でどんな時に使われるか実例を踏まえて解説

多変量解析と単変量解析の違いがわかったところで、多変量解析が医学研究においてどのように使われるのかを解説していきます。

多変量解析は医学研究において、非常に多用されます。

多変量解析が使われる場面を考えると、医学研究では主にこの4つの研究目的で使われるかなと思います。

  1. アウトカムの原因(要因)の同定に関する観察研究
  2. 介入研究(ランダム化・非ランダム化)
  3. 診断に関する研究
  4. 予後に関する研究

それぞれ詳しくみていきましょう。

 

多変量解析が使われる例1:アウトカムの原因(要因)の同定に関する観察研究

まずは、アウトカムの原因(要因)の同定に関する観察研究について。

例えば有名なのがフラミンガム研究ですね。

フラミンガム研究とは、1984年から心血管疾患の前兆となる因子および自然歴を明らかにするために、Framingham在住の男女5,209人を対象に開始された大規模な観察研究のこと。

観察研究ではアウトカムの原因(要因)に対して、因果関係を証明することはできません。

ですが、多変量解析を用いて交絡バイアスの影響を小さくすることで因果関係の推論は強めることができます

 

観察研究で用いられる多変量解析ですが、この場合の限界も知っておく必要があります。

それは、未知あるいは未測定の因子については調整することができない、ということ。

なので、どれだけ多変量解析で説明変数を入れたとしても、未知あるいは未測定の因子による交絡が残る可能性はあります

また、測定された因子についても完全に調整できるとは限りません

これらの限界は知っておく必要があります。

 

多変量解析が使われる例2:介入研究(ランダム化・非ランダム化)

次に使われる場面は、介入研究。

例えば新薬の開発ではほとんどの場合、ランダム化された介入試験(ランダム化比較試験)が実施されます。

ランダム化の大きな利点としては、群間の背景情報が揃うことにあります。

しかし、群間の背景情報が揃うことは「期待できる」が、絶対に揃う保証はありません

なので、アウトカムに影響があり、かつ、群間で違いのある因子は多変量解析で調整すべきなんです

 

また、非ランダム化の介入試験では多変量解析は必須です。

非ランダム化試験では、ベースライン時点で比較する群間に大きな違いが存在することの方が普通。

ベースライン時点で比較する群間に大きな違いが存在すれば、得られた結果が、群間の違いによるものなのか、背景情報の違いによるものなのか、区別ができないですよね。

なので、アウトカムに影響があり、かつ、群間で違いのある因子は多変量解析で調整すべきです。

 

多変量解析が使われる例3:診断に関する研究

次に、診断に関する研究です。

診断に関する研究とは、患者が「ある病気」なのかどうかを診断する最良の情報(変数)の組み合わせを決める研究のこと。

例えば、胸痛で救急外来に担ぎ込まれてきた患者が心筋梗塞なのかどうかを診断するアルゴリズムに関する研究なんかは有名です。

このような研究で多変量解析が用いられる場合、重要な視点があります。

それは、その診断アルゴリズムが「実際の現場で使いやすいかどうか」ということ。

例えば、正確に診断できるとしても、診断するまでに時間がかかれば緊急を要する現場では使うことが難しいですよね。

なので、多変量解析を用いることで「診断の正確さ」と「臨床現場での使いやすさ」の2点を考えなければなりません

 

多変量解析が使われる例4:予後に関する研究

最後に、予後に関する研究です。

例えば、5年後にがんが再発する確率などをその時点で利用できる情報の範囲で推測する(予後モデルを構築する)、といった目的で多変量解析が用いられます。

一つ注意点なのが、予後モデルは、モデルを作成した集団以外への妥当性は保証されていないという点。

例えば、男性だけでモデルを作った場合に女性の予後は予測できませんよね。

 

また、予後モデルを構築したり使用したりする際にも注意点があります。

それは、モデルに含まれている予後因子が全て揃わないと意味がない、ということ。

つまり、臨床医が容易に入手できるものじゃないとモデルが使われないものになってしまいます

特殊な遺伝マーカーを使っても、そのマーカーがどこでも測定できるものでなければ使えないですからね。

なので診断に関する研究と同様に、多変量解析を用いることで「予後の正確さ」と「臨床現場での使いやすさ」の2点を考えなければなりません

 

>>もう統計で悩むのは終わりにしませんか? 

↑1万人以上の医療従事者が購読中

多変量解析のモデルの妥当性は研究目的で使い分ける

多変量解析を用いる研究の場合、次に議論になるのが「その多変量解析のモデルが妥当なのかどうか」ということ。

多変量解析での「モデル」とは「含めている説明変数の数と種類」ということと同じだと思っていただければOKです。

今まで見てきた通り、医学研究では主に4つの目的で多変量解析が使われます。

しかし、4つの目的全てで多変量解析は使えるのですが、モデルの妥当性は研究目的で使い分ける必要があります。

モデルの妥当性を評価する方法は「クロスバリデーション」であったり「ブートストラップ」だったりですね。

なぜモデルの妥当性を評価するのは研究目的で異なるのでしょうか?

それぞれの研究目的を考えながら、モデルの妥当性の評価の有無を考えていきましょう。

 

アウトカムの原因(要因)の同定に関する観察研究の場合にはモデルの妥当性は不要

まず、アウトカムの原因(要因)の同定に関する観察研究の場合、モデルの妥当性を評価することは必ずしも必要ではありません。

というのも、このような研究では、「アウトカムとリスクファクターの関連を調べられれば良い」からです。

注目すべきリスクファクター以外の他の説明変数は交絡調整のために含めるもので、モデル自体がどうか、という議論はなしでよいわけです。

なぜなら、注目すべきリスクファクター以外の説明変数が交絡調整のために含まれているのであれば、研究によって説明変数は変わるはずです。

そのため、モデルの妥当性よりも

  • リスクファクターとアウトカムの生物学的妥当性
  • 先行研究における知見

などから総合的に判断するほうが重要になります。

 

介入研究(ランダム化・非ランダム化)の場合にはモデルの妥当性は不要

次に、介入研究の場合。

介入研究の場合も、モデルの妥当性を評価することは必ずしも必要ではありません。

というのも、アウトカムに対して介入の有無がどう違いをもたらすか?が分かれば良いからです。

他の説明変数は交絡調整のために含めるもので、モデル自体がどうか、という議論はなしでよいわけです。

なぜなら、介入の有無(群)の説明変数が交絡調整のために含まれているのであれば、研究によって説明変数は変わるはずです。

そのため、モデルの妥当性よりも

  • リスクファクターとアウトカムの生物学的妥当性
  • 先行研究における知見

などから総合的に判断するほうが重要になります。

 

診断や予後に関する研究の場合にはモデルの妥当性を評価することは必須

最後に、診断や予後に関する研究の場合です。

この目的の場合、これはモデルの妥当性評価は必須です。

なぜなら、個々人のことを予測することが目的なので、確度の高いモデルが求められるから

個々人のことを予測するためには、モデルに含まれる説明変数の種類や数、その偏回帰係数の値自体が重要になります。

そのため、モデルの妥当性評価は必須になりますよね。

 

まとめ

いかがでしょうか?

この記事では「多変量解析は医学研究でどう使われる?使い分けを実例を踏まえて解説」としてお伝えしました。

  • 多変量解析とは?単変量解析との違い
  • 多変量解析が医学研究でどんな時に使われるか
  • 多変量解析のモデルの妥当性に関する使い分け

について理解できたのなら幸いです!

期間・数量限定!書籍「統計を身につける5つのステップ」を無料プレゼント

第1章:臨床研究ではなぜ統計が必要なのか?計画することの重要性

第2章:研究目的をどれだけ明確にできるのかが重要

第3章:p値で結果が左右される時代は終わりました

第4章:多くの人が統計を苦手にする理由

第5章:統計を使えるようになるために今日から何をすれば良いか?

第6章:統計を学ぶために重要な環境

 

もしあなたがこれまでに、何とか統計をマスターしようと散々苦労し、何冊もの統計の本を読み、セミナーに参加してみたのに、それでも統計が苦手なら…

私からプレゼントする内容は、あなたがずっと待ちわびていたものです。

 

↓今すぐ無料で学会発表や論文投稿までに必要な統計を学ぶ↓

↑無料で学会発表や論文投稿に必要な統計を最短で学ぶ↑