この記事では「JMPで偏相関係数と偏相関図を出力する方法」として、例を交えながら分かりやすくお伝えします。
- 偏相関係数とは?
- JMPで偏相関係数を出力する方法
- JMPで偏相関図を出力する方法
をお伝えしますので、ぜひご覧くださいませ!
偏相関係数とは?
偏相関係数とは、”指定した変数の影響をなくした状態で”2つの変数間がどのように相関するか表す指標のこと。
言葉だけだと分かりにくいため、例を用いて説明しますね。
JMPのサンプルデータであるDiabetes.jmpを使用してみます。
サンプルデータを使用するためには、ヘルプ→サンプルの索引、と選択していきます。
そして、Diabetes.jmpは回帰の中にあります。
JMPのサンプルデータDiabetes.jmpを使用して偏相関係数を解説
例えば、年齢と血圧の相関を調べたい、ということを考えたとします。
そうした場合に、まず考えることは散布図+相関係数を出力してみる、ということ。
では散布図+相関係数をJMPで実施していきます。
分析→二変量の関係、を選択します。
そして、Xに年齢、Yに血圧を入れてみます。
そしてOKを押すと、下記のような散布図が出力され、さらに左上の赤い三角形から「要約統計量」を選択することで、相関係数(ピアソンの相関係数)が出力されます。
相関係数は0.335ありますので、医学的なデータとしては、やっぱり相関があるようなデータになっていた、ということになります。
でも一つ疑問が生じます。
それは、肥満な人も血圧高そうだよね、ということです。
つまり、肥満かどうかに関わらず年齢と血圧は相関するのか?、ということが疑問として生じた、ということ。
であれば、次は「肥満の影響を排除しても、年齢と血圧が相関するのかを調べたい」ということを思うんじゃないかなと。
この時に調べるのが偏相関係数なんです。
なぜなら、冒頭で偏相関係数とは、”指定した変数の影響をなくした状態で”2つの変数間がどのように相関するか表す指標のこと、という説明をしました。
「肥満の影響を排除しても、年齢と血圧が相関するのかを調べたい」というのは、まさに偏相関係数を出力する状況に当てはまっているのです。
JMPで偏相関係数を出力する方法
ということで、「肥満の影響を排除しても、年齢と血圧が相関するのか」ということを調べるために、JMPで偏相関係数を出力してみます。
JMPで、分析→多変量→多変量の相関、を選択します。
年齢、血圧、BMIの3つをYに入れてOKを押します。
すると、相関係数行列が出力されますので、多変量の左の赤い三角形から「偏相関係数行列」を選択します。
すると、偏相関係数の結果が出力されます。
結果として、肥満(BMI)の影響を排除した際の偏相関係数は0.29でした。
相関係数と大差のない値になったため、肥満の影響を排除したとしても、年齢と血圧が相関しそう、ということがわかりました。
JMPで偏相関図を出力する方法
最後に、JMPで偏相関図を出力してみます。
偏相関図はJMPver.17から実装された機能のようなので、17以前のバージョンをお持ちの方はこの機能が使えませんので、ご了承くださいませ。。
多変量の左の赤い三角形から「偏相関図」を選択します。
すると偏相関図が表示されるのですが、ちょっと分かりにくい図なので、図の中に偏相関の値を入れていきます。
偏相関図の左の赤い三角形で「偏相関の表示」にチェックします。
すると、偏相関係数付きの図が作成されました。
これだと分かりやすいですね。
さらに、「偏相関の絶対値」に0.25を入れると、偏相関の絶対値が0.25以上の関係にしか線が引かれなくなります。
今回は3つの変数なのでシンプルなのですが、多くの変数を考慮した偏相関図を作成した場合、ゴチャゴチャした図になることもありますので、「偏相関の絶対値」に数値を入れることで、表示させる線を制御するのがいいと思います。
まとめ
いかがでしたか?
この記事では「JMPで偏相関係数と偏相関図を出力する方法」として、例を交えながら分かりやすくお伝えしました。
- 偏相関係数とは?
- JMPで偏相関係数を出力する方法
- JMPで偏相関図を出力する方法
が理解できたのなら幸いです!
こちらの内容は、動画でもお伝えしておりますので、ぜひ併せてご覧くださいませ。
コメント