この記事ではEZRで相関係数を計算する方法についてお伝えします。
具体的には、以下の3つが分かるようになります!
- そもそも相関係数とはなんだっけ?
- パラメトリックな方法であるピアソンの相関係数を計算する方法
- ノンパラメトリックな方法であるスピアマンの相関係数を計算する方法
相関係数に関する詳細はこちらの記事にありますので、併せてご確認くださいませ。
相関係数とはそもそも何だったっけ?
EZRで相関係数を計算する方法をお伝えする前にまず、ちょっとだけ相関係数について復習です。
相関係数は二つの変数の関連(ばらつき度合い)を数値化したもの。
パラメトリックな方法としてはピアソンの相関係数があり、ノンパラメトリックな方法としてはスピアマンの相関係数があります。
ピアソンの相関係数とは?
ピアソンの相関係数は、二つの変数がどちらも正規分布を想定して相関係数を計算します。
そのため、変数が正規分布から程遠い場合には、ノンパラメトリックな方法を使うことになりますね。
スピアマンの相関係数とは?
スピアマンの相関係数とは、ノンパラメトリックな相関係数です。
ノンパラメトリックなので、二つの変数がどんな分布であろうと、全く関係なく相関係数を計算してくれます。
そのため、二つの変数がどちらも正規分布だと言えない場合には、スピアマンの相関係数を算出することを検討する必要があります。
EZRでピアソンの相関係数を計算する方法
相関係数について復習できたところで、EZRでまずはピアソンの相関係数を計算する方法について学んでいきましょう。
相関係数は二つの連続量に対する解析手法なので、二つ以上の連続変数が入っているデータを取り込みます。
今回は、下記のような架空データを使います。
xとyに相関関係があるのかを見ていきましょう!
EZRでピアソンの相関係数を算出するには「連続変数の解析」から!
EZRでピアソンの相関係数を算出するには、データを取り込んだあとに、「統計解析」→「連続量の解析」→「相関係数の検定(Pearsonの積率相関係数)」を選択します。
その後、相関係数を算出したい2つの変数を選択します。
今回はxとyの相関係数を算出したいため、xとyを選択します。(Ctrlキーを押しながらクリックすると複数選択できます)
そしてOKを押すと、相関係数が出力されます。
結果の見方は以下の通りです。
今回のデータでは、相関係数が0.898と、かなり高い相関になっています。
そしてP値も2.36e-22(e-22は10の-22乗の意味)と、かなり小さい結果になっていることがわかります。
EZRでピアソンの相関係数を算出すると、数字だけではなく散布図も出力されます。
相関係数の値だけではなく、グラフで外れ値がないかなどは確認する必要がありますので、散布図も一緒に確認しましょう。
散布図を確認しても直線上の近くにあるデータがほとんどですので、これぐらいのデータであれば、相関が高いんだなという感覚を掴んでいただければと思います。
EZRでスピアマンの相関係数を計算する方法
ピアソンの相関係数を算出できたところで、次にスピアマンの相関係数を出力してみます。
データは、先程と同じデータを使ってみましょう。
EZRでスピアマンの相関係数を算出するには「ノンパラメトリック検定」から!
EZRでスピアマンの相関係数を算出するには、データを取り込んだあとに「統計解析」→「ノンパラメトリック解析」→「相関係数の検定(Spearmanの積率相関係数)」を選択します。
その後、相関係数を算出したい2つの変数を選択します。
今回はxとyの相関係数を算出したいため、xとyを選択します。(Ctrlキーを押しながらクリックすると複数選択できます)
そしてOKを押すと、相関係数が出力されます。
結果の見方は以下の通りです。
今回のデータでは、スピアマンの相関係数が0.878と、かなり高い相関になっています。
そしてP値も2.2e-16(e-16は10の-16乗の意味)と、かなり小さい結果になっていることがわかります。
二つの変数が正規分布に近いとピアソンの相関係数もスピアマンの相関係数も同じような結果になる
今回のデータでは、二つの変数が正規分布に近い分布だったため、ピアソンの相関係数でもスピアマンの相関係数でも同じような結果になったものと思います。
念のため、xとyのデータのヒストグラムを確認していきましょう。
真ん中にデータが集まっていて、そこから左右均等にデータの数が少なくなっていってそうなグラフですね。
yは正規分布か?と疑問を持つようなヒストグラムの形ですが、これぐらいでも正規分布と仮定して分析を進めてもいいでしょう。
まとめ
この記事ではEZRで相関係数を計算する方法についてお伝えしました。
以下の3つが理解できていれば幸いです!
- そもそも相関係数とはなんだっけ?
- パラメトリックな方法であるピアソンの相関係数を計算する方法
- ノンパラメトリックな方法であるスピアマンの相関係数を計算する方法
相関係数に関する詳細はこちらの記事にありますので、併せてご確認くださいませ。
コメント
コメント一覧 (1件)
[…] 例えば、架空のデータをEZRで2つの連続変数に対する相関係数の分析を実施すると、以下の通り散布図と回帰直線と相関係数が出力されます。 […]