順序がないカテゴリカルデータと連続データの「相関」が相関比である
2 群と連続データの相関比
相関比とは、2値のカテゴリカルデータを0と1のダミー変数にして、連続データとPearsonの積率相関係数を計算する。
計算結果の絶対値が相関比である。
カテゴリカルデータが 0 に比べて 1 のとき、連続データが大きいとか、小さいとか、の指標になる。
ギリシャ文字ではイータ η と表現する。
3 群以上と連続データの相関比
相関比は、一元配置分散分析の分散分析表に登場するグループ間平方和と全平方和の比の平方根に等しい。
分散分析のグループ間平方和と全平方和の比は、SPSSではイータ2乗と出力される。
これは以下の分散分析表のグループ間と全体の平方和の比である。
つまり 2034.259 / 9232.815 = 0.2203292 となる。
このイータ2乗の平方根が 相関比 イータ というわけである。
エクセルにコピペして =SQRT() で計算すれば、算出できる。
計算式
計算結果
分散分析の結果から計算されるということは、2 群でも 3 群以上でも相関比は計算できる。
ただし、3 群以上になると、もはや群自体には大きいも小さいもないので、「相関」なのかどうかよくわからない指標になる。
互いに「相関する(あいかんする)」ということで、大きいとか小さいとかは超越していると、無理やり考えれば考えられなくもない。
相関比とはそういう指標である。
まとめ
カテゴリカルデータと連続データの「相関」である相関比を紹介した。
ゼロ1のダミー変数と連続データの相関係数の絶対値が相関比 イータ である。
分散分析表のグループ間平方和と全平方和の比(イータ2乗)の平方根であるので、3 群以上でも計算できる。
ただし、3 群以上になると、名義尺度には大きい・小さいがないため、互いに関連している指標という意味合いになる。
コメント
コメント一覧 (1件)
[…] SPSS の出力で学ぶ相関比 順序がないカテゴリカルデータと連続データの「相関」が相関比である […]