目的変数が3値以上のカテゴリカルデータの場合は、多項ロジスティック回帰分析を実施する。
多項ロジスティック回帰分析をわかりやすく解説。
SPSSで実施する方法と結果の見方。
多項ロジスティック回帰分析とは?
3値以上のカテゴリカルデータが目的変数の場合の、ロジスティック回帰分析である。
通常の2値が目的変数の場合は、二項ロジスティック回帰分析と呼ばれる。
3値以上は、「多い」ので、多項だ。
多項ロジスティック回帰分析をSPSSで行うには?
データを準備した後、分析→回帰→多項ロジスティックだ。
今回使用したサンプルデータは、以下のリンク先で提供されているデータである。
Multinomial Logistic Regression | SPSS Data Analysis Examples
ダイアログボックスが開いたら、従属変数、因子(カテゴリカルデータ)、共変量(連続データ)を投入する。
従属変数の設定にポイントがある。
従属変数にも参照カテゴリを設定しないといけない。
3値以上あるからだ。
参照カテゴリをクリックして、ユーザー指定を選択し、2(academic)を入力。
3値のカテゴリの真ん中を参照カテゴリにした。
最初のカテゴリ(一番小さい数値)や最後のカテゴリ(一番大きい数値)でもどれでも参照にできる。
ちなみに、独立変数の因子の参照カテゴリは選べず、最後のカテゴリ(一番大きい数値)で固定だ。
あとはOKをクリックするだけで、計算結果が出てくる。
多項ロジスティック回帰分析をSPSSで実施した結果の見方
まずは解析したデータの要約である。
type of programが従属変数、sesが因子型の説明変数。
連続データの説明変数、つまり共変量のwriting scoreの情報はない。
次に、モデルの適合度の検定である。
統計学的有意であれば、今回解析したモデルは意味があると言える。
疑似R2乗は参考程度に。
重回帰分析の決定係数のような数値と思えばよい。
決定係数については、以下も参照のこと。
尤度比検定の結果は、どの変数を増やすと、意味があるかどうかの検定をしている。
どちらの変数も統計学的有意で、モデル内で意味があると言える。
メインの結果が以下である。
academicを参照としたときのgeneralとvocationのオッズ比がExp(B)の列に出力されている。
オッズ比の95%信頼区間が標準で出力されるのは助かる。
論文にこのままの表を貼り付けてもいいくらいコンパクトできれいにまとまっていると思う。
結果の読み方の一例として、例えば以下のとおりである。
academicと比べてgeneralであるオッズ比は、writing scoreが1点上がるごとに0.944(95%信頼区間:0.905-0.984)と下がっていく。
ses=3 (high) に比べて、ses=1 (low) のオッズ比が大きく、3.199(95%信頼区間:1.168-8.764)であった。
同様にacademicに比べてvocationであるオッズ比は、writing scoreが1点上がるごとに0.893(95%信頼区間:0.855-0.932)と下がっていく。
ses=3 (high) に比べて、ses=2 (middle) のオッズ比は大きく、3.575 (95%信頼区間:1.313-9.736)であった。
まとめ
目的変数が3値以上のカテゴリカルデータの場合の多項ロジスティック回帰分析についてわかりやすく解説した。
SPSSでの実施方法と結果の見方を紹介した。
参考サイト
Multinomial Logistic Regression | SPSS Data Analysis Examples
参考書籍
SPSSによる応用多変量解析
コメント