この記事では統計ソフトSPSSを使用した回帰分析の実施方法と分析結果の解釈を行います。
回帰分析は相関と少し似ていますが、内容はかなり違います。
早速ですが、SPSSを使用した回帰分析について一緒に考えていきましょう!
回帰分析とは?
つまり相関は単なる関連。
回帰分析も2つの変数の関係を表す点では相関係数と似ています。
しかし、回帰分析は一方の変数から他方の変数を予測するという意味をもち、回帰式で2つの変数の関係を表します。
回帰分析は因果関係(原因と結果の関係性)を仮定して一方の変数から他方の変数への影響度合いを知るという目的で用いられます。
たとえば、体重と身長の単純な関係度合いを数値で表したいときは相関係数。
体重から身長を予測したい,もしくは体重が身長に及ぼす影響を知りたいといった関係(因果関係)を知りたいときは回帰分析を用います。
それでは実際にSPSSを使って分析してみましょう!
SPSSで回帰分析を実施する
まずは今回使用するデータは2つの変数を使います。
74名の人を対象として、「年齢」から「生存期間(日数)」を予測できるか?・・・を明らかにするために予測式(回帰式)を作るというのが解析の目的になります。
SPSSに直接データを打ち込む場合は[ファイル]→[新規作成]→[データ]の順に進みます。
・既にデータ入力が終了している場合は、[ファイル]→[開く]→[データ]で任意のデータを選択します。
・Excelにデータを入力している場合は、[ファイル]→[データのインポート]→[Excel]の順に進み、データをインポートします。
「年齢」をX(独立変数とか説明変数という)、「生存期間(日数)」をY(従属変数、目的変数という)として予測式(回帰式)を作ります!
まず下図の通り【分析】ー【回帰】ー【線型】を選択します。
回帰式のYにする変数(ここでは「生存期間(日数)」)を従属変数にいれます。
Xにする変数(ここでは「年齢」)を独立変数にいれます。
【統計量】をクリックして、 【推定値】 、 【信頼区間】 、 【モデルの適合度】 をチェックします!
最後に 【続行】【OK】 をクリックして終了です。
SPSSで回帰分析をした結果の解釈
SPSSで回帰分析をした検定結果は、下図ように出力されます。
下記の番号は、手順①〜⑤の順に従います。
①の分散分析表の[有意確率]が第1の関門です。
.006なのでpく0.01で有意であり.「この回帰式は予測式として有意に役立つ可能性がある」といえます。
②の[有意確率]が第2の関門です。
下行の有意確率を見ましょう。
上行は定数の有意確率なので無視していいです。
これも.006なのでpく0.01で有意であり,「この回帰係数の傾きは有意に0ではない」となります。
信頼区間も参照できますが,具体的にどれくらいであればよいという基準はないです。
③の影響度合いは,標準化された係数なので単位に依存しない値です。
相関係数と同じで、土1になるほど影響度合いが大きく、まれに土1を超えることがあります。
④は,回帰式の値が出力されています。
上行は定数、下行は係数なので、
生存期間(日数)=1129.067+(-10.031)×年齢という式ができます。
⑤は回帰式の適合度、つまりモデルがどれだけフィットしているかを表しています。
[R]、[R2乗]とも0〜1の範囲をとり、当然ですががR>R2乗となります。
これらは1に近づくほど予測精度が良く、一般にはR≧0.7、R2乗≧0.5が望ましいとされています。
ただしこの値は目安なだけであり、これらの値を下回ったからといって即座にダメなモデルである、ということではないのでご注意を。
この例では0.102だから、回帰式そのものは有意だが、フィットはそれほどよくない予測式である可能性があります。
レポートには「この回帰式は分散分析表よりpく0.01であり、回帰係数もpく0.01だった。しかし決定係数R2乗は0.102と小さく、予測精度は低いことがわかった」などのように書きましょう。
回帰式の精度を表記するときはR2乗=0.102と書くときもあるし、寄与率として10.2%と記すこともあります。
SPSSで回帰分析まとめ
今回は統計ソフトSPSSを使用した回帰分析の実施方法と分析結果の見方を説明しました。
回帰分析は相関とは違い因果関係を仮定するものです。
原因(独立変数)と結果(従属変数)に投入する変数は適当に投入してはダメです!
どちらが原因でどちらが結果なのかを吟味した上で変数を投入しましょう!
実際に自分で分析して覚えましょう!
お疲れ様でした。
コメント