この記事では統計ソフトSPSSを使用した相関の実施方法と分析結果の解釈を行います。
相関は検定の中で使われることが非常に多い手法です。
簡単に言えば、2つの変数の間の関連の強さ(程度)をみることを相関といいます。
2つの変数の一方の変数が増えるともう一つの変数も増える(または減る)という関係をみるもので、正の相関、負の相関があります。
相関の強さの指標としては相関係数があります。
それでは相関について一緒に考えていきましょう!
SPSSでピアソンの積率相関係数の求め方!
一般に相関係数というときは、パラメトリックな手法のピアソンの積率相関係数(Pearson’s product moment correlation coefficient)のことをいいます。
ピアソンの相関係数を出力する際には、データが以下の条件を満たしていることを想定しています。
- XもYも正規分布に従うデータであること
- 比率尺度、間隔尺度、段階数の多い順序尺度の一部データ
- 対応のある2変数以上のデータ
それでは実際にデータを使ってピアソンの相関係数をしてみましょう。
まずは今回使用するデータは2つの変数を使います。
74名の人を対象として、「年齢」と「生存期間(日数)」の関連の程度を明らかにするために相関係数を知りたいというのが解析の目的になります。
- SPSSに直接データを打ち込む場合は[ファイル]→[新規作成]→[データ]の順に進みます。
- 既にデータ入力が終了している場合は、[ファイル]→[開く]→[データ]で任意のデータを選択します。
- Excelにデータを入力している場合は、[ファイル]→[データのインポート]→[Excel]の順に進み、データをインポートします。
データをセットできたら下図のように①[分析(A)]-②[相関(c)]-③[2変量(B)]を選びます。
下図のダイアログボックスで、対象とする変数ここでは「年齢」と「生存期間(日数)」の2つの変数をクリック(0)します。
⇒をクリックして、変数を右のボックスに移します。
[相関係数]の[Pearson(N)]にチェックして最後にOKをクリックしたら分析が開始されます。
SPSSで出力したピアソンの相関係数の結果の解釈方法
下図の表は相関行列表です。
表中の-.319が相関係数です。
この数値の横に“**(アスタリスク)”が付記されています。
*はpが有意な値のときに記す印で、一般に論文の表などではp<0.05なら“*”、p<0.01なら“**”を付けている結果を見ることが多いです。
SPSSでは、相関係数の有意性についてアスタリスクで出力できるので便利です。
-.319の下段は.006であるから、1%水準で有意であり、 「年齢」と「生存期間(日数)」は1%未満で有意な相関があったとなります。
相関係数のP値が小さい時の解釈としては、相関がより強い、ということではありませんのでそこは正確に理解しましょう!
ところで、表の左下対角部分にも同じ値が出力されています。
「年齢」と「年齢」の相関係数、 「生存期間(日数)」と「生存期間(日数)」の相関係数は当然ですが1と表記され、それを対角線として右上と左下部分に同じ値が出力されるという相関行列表の特徴があります。
見る所は右上だけか左下のいずれか一方だけでいいです。
SPSSでスピアマンの順位相関係数(ノンパラメトリックな手法)!
順位相関係数は、ノンパラメトリックな相関係数を出力する手法です。
順位相関係数の代表的なものとして、 スピアマンの順位相関係数(Spearman ‘s rank correlation coefficient)があります。
それではピアソンの相関係数と同じく、「年齢」と「生存期間(日数)」の順位相関係数を求めてみましょう。
データをセットできたら下図のように①[分析(A)]-②[相関(c)]-③[2変量(B)]を選びます。
下図のダイアログボックスで、対象とする変数ここでは「年齢」と「生存期間(日数)」の2つの変数をクリック(0)します。
⇒をクリックして、変数を右のボックスに移します。
[相関係数]の[Speaman]にチェックして最後にOKをクリックしたら分析が開始されます。
SPSSで出力されたスピアマンの順位相関係数の結果の読み方
下図の表が検定の結果です。基本的にピアソンの相関係数のときと同じです。
図中の-.298がスピアマンの順位相関係数になります。
p=.010ですので、「5%未満で有意な相関がある」となります。
相関係数の解釈の目安
相関係数の解釈の目安としては以下を参考にしてください。
かなり強い(高い)相関がある:r=±1.0~±0.7
かなり相関がある:r=±0.7~±0.4
やや相関がある:r=±0.4~±0.2
ほとんどなし:r≦±0.2
報告書には「ピアソンの相関係数はr=-0.319であり、p=0.006であった」と記載するのが良いです。
結果記載で一番NGなのが「相関係数の検定結果、有意だった」というような、有意かどうかだけを記載すること。
なぜなら、「相関係数が大きいことと、相関係数の検定が有意であることは、切り離して考える必要がある」ためです。
詳しくはぜひ相関係数に関する詳細なこちらの記事をご確認くださいませ。
SPSSでの相関係数まとめ
今回は相関係数を実施しました。
まずは2つの変数について正規分布かどうか等の適用条件を確認したうえで、相関係数(パラメトリック)なのか順位相関係数(ノンパラメトリック)なのかを選び分析してください。
分析自体については非常に理解しやすい検定だったかと思います。
それでは、実際に分析して理解を深めてみましょう。
おつかれさまでした!
コメント