EZRの使い方

EZRで相関係数を計算する方法!ピアソンやスピアマンはどうやって算出する?

この記事ではEZRで相関係数を計算する方法についてお伝えします。

具体的には、以下の3つが分かるようになります!

  • そもそも相関係数とはなんだっけ?
  • パラメトリックな方法であるピアソンの相関係数を計算する方法
  • ノンパラメトリックな方法であるスピアマンの相関係数を計算する方法

相関係数に関する詳細はこちらの記事にありますので、併せてご確認くださいませ。

 

>>もう統計で悩むのは終わりにしませんか? 

↑1万人以上の医療従事者が購読中

相関係数とはそもそも何だったっけ?

EZRで相関係数を計算する方法をお伝えする前にまず、ちょっとだけ相関係数について復習です。

相関係数の詳しい説明は、こちらの記事で確認してくださいね!

 

相関係数は二つの変数の関連(ばらつき度合い)数値化したもの。

パラメトリックな方法としてはピアソンの相関係数があり、ノンパラメトリックな方法としてはスピアマンの相関係数があります。

 

ピアソンの相関係数とは?

ピアソンの相関係数は、二つの変数がどちらも正規分布を想定して相関係数を計算します。

そのため、変数が正規分布から程遠い場合には、ノンパラメトリックな方法を使うことになりますね。

 

スピアマンの相関係数とは?

スピアマンの相関係数とは、ノンパラメトリックな相関係数です。

ノンパラメトリックなので、二つの変数がどんな分布であろうと、全く関係なく相関係数を計算してくれます。

そのため、二つの変数がどちらも正規分布だと言えない場合には、スピアマンの相関係数を算出することを検討する必要があります。

 

EZRでピアソンの相関係数を計算する方法

相関係数について復習できたところで、EZRでまずはピアソンの相関係数を計算する方法について学んでいきましょう。

相関係数は二つの連続量に対する解析手法なので、二つ以上の連続変数が入っているデータを取り込みます。

今回は、下記のような架空データを使います。

xとyに相関関係があるのかを見ていきましょう!

 

EZRでピアソンの相関係数を算出するには「連続変数の解析」から!

EZRでピアソンの相関係数を算出するには、データを取り込んだあとに、「統計解析」→「連続量の解析」→「相関係数の検定(Pearsonの積率相関係数)」を選択します。

その後、相関係数を算出したい2つの変数を選択します。

今回はxとyの相関係数を算出したいため、xとyを選択します。(Ctrlキーを押しながらクリックすると複数選択できます)

そしてOKを押すと、相関係数が出力されます。

結果の見方は以下の通りです。

今回のデータでは、相関係数が0.898と、かなり高い相関になっています。

そしてP値も2.36e-22(e-22は10の-22乗の意味)と、かなり小さい結果になっていることがわかります。

 

EZRでピアソンの相関係数を算出すると、数字だけではなく散布図も出力されます。

相関係数の値だけではなく、グラフで外れ値がないかなどは確認する必要がありますので、散布図も一緒に確認しましょう。

散布図を確認しても直線上の近くにあるデータがほとんどですので、これぐらいのデータであれば、相関が高いんだなという感覚を掴んでいただければと思います。

 

>>もう統計で悩むのは終わりにしませんか? 

↑1万人以上の医療従事者が購読中

EZRでスピアマンの相関係数を計算する方法

ピアソンの相関係数を算出できたところで、次にスピアマンの相関係数を出力してみます。

データは、先程と同じデータを使ってみましょう。

 

EZRでスピアマンの相関係数を算出するには「ノンパラメトリック検定」から!

EZRでスピアマンの相関係数を算出するには、データを取り込んだあとに「統計解析」→「ノンパラメトリック解析」→「相関係数の検定(Spearmanの積率相関係数)」を選択します。

その後、相関係数を算出したい2つの変数を選択します。

今回はxとyの相関係数を算出したいため、xとyを選択します。(Ctrlキーを押しながらクリックすると複数選択できます)

そしてOKを押すと、相関係数が出力されます。

結果の見方は以下の通りです。

今回のデータでは、スピアマンの相関係数が0.878と、かなり高い相関になっています。

そしてP値も2.2e-16(e-16は10の-16乗の意味)と、かなり小さい結果になっていることがわかります。

 

二つの変数が正規分布に近いとピアソンの相関係数もスピアマンの相関係数も同じような結果になる

今回のデータでは、二つの変数が正規分布に近い分布だったため、ピアソンの相関係数でもスピアマンの相関係数でも同じような結果になったものと思います。

念のため、xとyのデータのヒストグラムを確認していきましょう。

真ん中にデータが集まっていて、そこから左右均等にデータの数が少なくなっていってそうなグラフですね。

yは正規分布か?と疑問を持つようなヒストグラムの形ですが、これぐらいでも正規分布と仮定して分析を進めてもいいでしょう。

 

まとめ

この記事ではEZRで相関係数を計算する方法についてお伝えしました。

以下の3つが理解できていれば幸いです!

  • そもそも相関係数とはなんだっけ?
  • パラメトリックな方法であるピアソンの相関係数を計算する方法
  • ノンパラメトリックな方法であるスピアマンの相関係数を計算する方法

相関係数に関する詳細はこちらの記事にありますので、併せてご確認くださいませ。

 

>>EZRでT検定を実施する方法

今だけ!いちばんやさしい医療統計の教本を無料で差し上げます

第1章:医学論文の書き方。絶対にやってはいけないことと絶対にやった方がいいこと

第2章:先行研究をレビューし、研究の計画を立てる

第3章:どんな研究をするか決める

第4章:研究ではどんなデータを取得すればいいの?

第5章:取得したデータに最適な解析手法の決め方

第6章:実際に統計解析ソフトで解析する方法

第7章:解析の結果を解釈する

 

もしあなたがこれまでに、何とか統計をマスターしようと散々苦労し、何冊もの統計の本を読み、セミナーに参加してみたのに、それでも統計が苦手なら…

私からプレゼントする内容は、あなたがずっと待ちわびていたものです。

 

↓今すぐ無料で学会発表や論文投稿までに必要な統計を学ぶ↓

↑無料で学会発表や論文投稿に必要な統計を最短で学ぶ↑

COMMENT

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です