MENU

相関と回帰の違いは何か?

相関と回帰はどう違うか? 両方とも2つのデータの関係性を見ているわけで、とても似ている。相関と回帰の違いについて、まとめてみる。

>>もう統計で悩むのは終わりにしませんか? 

↑期間・数量限定で無料プレゼント中!

目次

相関と回帰の根本的な違いは?

相関は、相関係数が中心で、 データXとデータYの お互いの関係性を見る。 相関分析には、 Y = aX + b みたいな式は出て来ない。

回帰は、回帰式(Y = aX + b みたいな式)が中心で、 データXによるデータYの予測のための式を作るもの。 その式によって、新たなデータXからデータYを予測できる。

Y = aX + b の式のaとbを推定する。ただ、推定したaとbを使って、XからYを計算しても、 実際観測されたYとはずれる。 そのずれを残差と言う。

残差を小さくするようにしてaとbを求める。 この方法が最小二乗法。

相関には出てこない登場人物がたくさん出てくるのが、回帰の特徴だ。

相関と回帰の考え方の違いは?

相関は、XとYとが関係しているかもしれないとは考えているが、 どちらが原因でどちらが結果かを考えていない。

回帰は、Xが原因でYが結果であると想定して、話を進めているのが特徴。 必ずYを結果として考えて、想定する式が Y = aX + b だ。

>>もう統計で悩むのは終わりにしませんか? 

↑1万人以上の医療従事者が購読中

相関と回帰の検定の違いは?

相関は、 母集団での相関係数(母相関係数) がゼロかどうかの検定を行う。 帰無仮説は母相関係数がゼロ。 統計学的有意になり、母相関係数がゼロではないとの結果であれば、標本の相関係数の大きさから、意味がある相関関係かどうかを見極める。

回帰は、回帰式 Y = aX + b の回帰係数 a、 つまり1次直線の傾きが ゼロかどうかの検定を行う。 仮説検定が統計学的に有意であれば、 回帰係数がゼロではないと結論できて、 回帰式に意味があると言える。 ただし、予測性能は別問題。 別途、チェックする必要がある。

相関係数と回帰係数の計算式の違いは?

相関係数は、XとYの共変動をXの変動とYの変動の平方根の積で割ったものである。

$$ \frac{\sum (X – \bar{X}) (Y – \bar{Y})}{\sqrt{\sum (X – \bar{X})^2} \sqrt{\sum (Y – \bar{Y})^2}} $$

$ \bar{X} $, $ \bar{Y} $ は、それぞれ X の平均、Y の平均である。

回帰係数は、XとYの共変動をXの変動で割ったものである。

$$ \frac{\sum (X – \bar{X}) (Y – \bar{Y})}{\sum(X – \bar{X})^2} $$

なので、値は当然異なる。

まとめ

根本的な違い:相関と回帰の違いは、 データ X と データ Y がお互い同じ程度の影響力(同様の役割)と考える相関か、 データXでデータYを予測すると考える回帰かの違い。

考え方の違い:原因と結果を意識しない相関か、 原因と結果を意識する回帰かの違い。

検定の違い:母相関係数がゼロかどうかの検定をするのが相関で、 回帰係数がゼロかどうかの検定をするのが回帰。

計算式の違い:相関係数と回帰係数は計算式が異なる。

相関と回帰の違いは何か?【動画】

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

リサーチクエスチョン探し?データ分析?論文投稿?、、、で、もう悩まない!

第1章臨床研究ではなぜ統計が必要なのか?計画することの重要性
  • 推定ってどんなことをしているの?
  • 臨床研究を計画するってどういうこと?
  • どうにかして標本平均を母平均に近づけられないか?
第2章:研究目的をどれだけ明確にできるのかが重要
  • データさえあれば解析でどうにかなる、という考え方は間違い
  • 何を明らかにしたいのか? という研究目的が重要
  • 研究目的は4種類に分けられる
  • 統計専門家に相談する上でも研究目的とPICOを明確化しておく
第3章:p値で結果が左右される時代は終わりました
  • アメリカ統計協会(ASA)のp値に関する声明で指摘されていること
  • そうは言っても、本当に有意差がなくてもいいの…?
  • なぜ統計専門家はp値を重要視していないのか
  • 有意差がない時に「有意な傾向があった」といってもいい?
  • 統計を放置してしまうと非常にまずい
第4章:多くの人が統計を苦手にする理由
  • 残念ながら、セミナー受講だけで統計は使えません。
  • インプットだけで統計が使えない理由
  • どうやったら統計の判断力が鍛えられるか?
  • 統計は手段なので正解がないため、最適解を判断する力が必要
第5章:統計を使えるようになるために今日から何をすれば良いか?
  • 論文を読んで統計が使えるようになるための5ステップ
第6章:統計を学ぶために重要な環境
  • 統計の3つの力をバランスよく構築する環境

以下のボタンをクリックして、画面に出てくる指示に従って、必要事項を記入してください。

この記事を書いた人

統計 ER ブログ執筆者

元疫学研究者

統計解析が趣味

コメント

コメント一覧 (1件)

コメントする

目次