SPSSの使い方

SPSSでカイ二乗検定!フィッシャーの正確確率検定との違いやP値の解釈も

この記事では統計ソフトSPSSを使ってカイ二乗検定の実施方法と分析結果の解釈を行います。

SPSSによるカイ二乗検定では分割表(クロス集計表)と呼ばれる表を基に考えていく検定方法となります。

それではカイ二乗検定について具体例を基に考えていきましょう!

 

カイ二乗検定とは?

例えば、「運動習慣の有無」と「性別」の関連を調べなければならないとします。

そこで、運動習慣のある人は男性に多いのではなかろうか?

とか、運動習慣のない人は女性に多いのではなかろうか?

という行と列の関連性を知りたいときに、カイ二乗検定(カイ二乗独立性の検定とも言います)を用います。

 

カイ二乗検定とは?計算式まで簡単に分かりやすく!分割表の検定分割表の解析で出てくる検定は2つです。 それは、「カイ二乗検定」と「フィッシャーの直接確率検定」です。 この記事では...

 

この記事ではSPSSでのカイ二乗検定の実施方法について具体的に説明していきます。

 

分割表(クロス集計表)

SPSSでカイ二乗検定を行うには上の表のような分割表クロス集計表)を用います。

上の分割表は2行2列になっているので、「2×2分割表」と呼びます。

分割表とは?例を使ってわかりやすく!2つの検定も理解しよう分割表とはどんな表だろう? 私も初めて「分割表」という文字を目にした時には全くイメージできませんでした。。 分割表と...

 

上記の表の例では男女合わせて40人(男性20名、女性20名)を対象としています。

仮に、性別と運動習慣の有無が全く関係ないとすれば、理論的に各セルは10人ずつ均等に該当するはず・・・ですよね?

(よりわかりやすく言えば、女性—運動習慣あり10人、女性—運動習慣なし10人、男性—運動習慣あり10人、男性—運動習慣なし10人に均等に分かれるはずです。)

この理論的に各セルが均等になるはずの「10人」という度数(人数)を期待度数と言います。

表に示される通り、実際の人数(観察度数)は、女性-運動習慣ありが8人、女性一運動習慣なし12人、男性一運動習慣あり14人、男性一運動習慣なしが6人なので、

これらのうちどのセルの人数が統計的に期待度数よりも多い、または少ないということについてカイ二乗分布の値を利用して検定するのがカイ二乗検定になります。

 

カイ二乗検定に適用できるデータの条件とは

カイ二乗検定を用いることができるデータの条件は以下の通りです。

  • 名義尺度のデータであること。
  • 順序尺度のデータでも適用となる(ただし段階数が多くないとき)。

 

SPSSでカイ二乗検定を実施する

それではSPSSを使ってカイ二乗検定を行っていきましょう。

まずは今回使用するデータを読み込みます。

今回のデータは、性別(女性・男性)運動習慣の有無(あり・なし)を用います。

 

SPSSに直接データを打ち込む場合は、[ファイル]→[新規作成]→[データ]の順に進みます。

既にデータ入力が終了している場合は、[ファイル]→[開く]→[データ]で任意のデータを選択します。

Excelにデータを入力している場合は、[ファイル]→[データのインポート]→[Excel]の順に進み、データをインポートします。

 

その後、下図のように[分析]→[記述統計]→[クロス集計表]を選択するとウィンドウが表示されます。

性別」、「運動習慣」の各名義尺度データを[]と[]のボックスに矢印➡か、ドラッグ&ドロップで入力します。

 

その後、[統計量]をクリックしたら[統計量の指定]のウィンドウが表示されるので、[カイ2乗]、[分割係数]、[PhiおよびCramer V(P)]に✓を入れ[続行]をクリックします。

次に、[セル]をクリックすると[セル表示の設定]のウィンドウが表示されます。

そこで。[観測]、[調整済みの標準化]に✓を入れ、[続行]をクリックします。

最後に[クロス集計表]のウィンドウに戻ったところで[OK]をクリックすると分析が始まります。

 

カイ二乗検定結果の読み方

上記の通りにカイ二乗検定を実施すると、問題なく結果が表示されます。

まずは、上の表の①「a.0セル(0.0%)は期待度数が5未満です」の”0.0%“の値を見ます。

この①の値が20%未満となっているときは表中②の[Pearsonのカイ2乗]の[漸近有意確率(両側)]で判断し、この①の値が20%以上となっているときは表中③の[Fisherの直接法]の結果で判断します。

 

この結果では0.0%(20%未満)なので、表中②で判断します。

表中②の[Pearsonのカイ2乗]の[漸近有意確率(両側)]がカイ二乗検定の結果そのものになります。

 

②または③がp<0.05さらにはp<0.01であったときは、割表のどこの頻度が有意に多く、どこの頻度が有意に少ないかを見ます。

そこで、分割表の頻度やパーセントといった実際の値を見て判断しがちですが、その判断は間違いですので注意しましょう。

そういった場合は④の[調整済み残差]を参照します。

この値が2(正確には1.96)以上のときは有意に他の頻度よりも多いと判断し、

-2(正確には-1.96)以下のときには有意に他の頻度よりも少ないと判断します。

今回の分析結果では[Pearsonのカイ2乗]の[漸近有意確率(両側]の値が有意ではない(p=0.057)ので[調整済み残差]を見るまでもないですが、、、、

 

運動習慣ありの女性で-1.9となっています。これが-2.0以下であれば有意に少ないということになります。

 

全体としてどの程度関連性があるかを知るには、⑤の[ファイ]を参照します。

このファイ(φ)行と列の関連度合いを表す連関係数というものです。

連関係数は名義尺度データの相関係数のようなもので

-1〜1または0〜1の範囲をとります。

有意確率がp<005またはp<001のときに判断します。

今回のデータ分析の結果ではφ=-0.302p=0.057有意ではありません。

 

カイ二乗検定の結果を論文やレポートに記載する方法

結果を論文やレポート等に記載する時は、

例えば

「運動習慣の有無と性別の関連についてカイ二乗検定を実施したところ、p=0.057で有意差は得られなかった。また調整済み残差による頻度の差も見られず、関連度を表す連関係数φ=-0.302で有意ではなかった」

と記載すればいいですね。

 

まとめ

今回はカイ二乗検定を実施しました。

キーワードは、クロス集計表、Pearsonのカイ二乗の有意確率、調整済み残差、連関係数φですので用語の意味をしっかりと理解しましょう。

そして、SPSSによる実際の分析の仕方を繰り返し復習してみてください。

SPSSの使い方:T検定のやり方と結果の見方をわかりやすく解説!統計学的検定の中で、一番有名といっても過言ではないT検定。 今回の記事では、T検定をSPSSで実施する方法を解説します。 医薬研究でよく用いられるSPSSの使い方を、ぜひ学んでみてください。...
SPSSで分散分析(ANOVA)のやり方と結果の見方をわかりやすく解説!データが3群以上ある時の検定でよく用いられるのが分散分析です。 analysis of varianceの頭文字をとってANOVAとか言ったりもします。 同じ分散分析でも、正規分布、非正規分布といったデータの違いによって実施する分析は異なります。 ですので、扱う群のデータが正規分布なのか?非正規分布なのか?を最初の段階で確認する事が重要です! 例えば一つの要因の差を分析したい場合、扱う群のデータが正規分布であれば、パラメトリック検定である一元配置分散分析。 非正規分布であれば、ノンパラメトリック検定であるクラスカルウォリス検定。 をSPSSではできます。 この記事では統計解析ソフトSPSSを使った分散分析の実施方法について具体的に説明していきます。 もちろん、分散分析の結果の解釈についても一緒に見ていきますのでご安心を。...
論文化に必要な統計に絞った地図あります

 

  • パソコンに向かってもなぜか筆が進まない…
  • 学会発表は結構たくさんしているのに、なぜ論文が出ないのだろう…
  • こんなに忙しいのに、いつ論文を書いたらいいのか…
  • 一度は書いたはずの論文がお蔵入りに…どうすればいいの…
  • データはあるのになぜ論文化まで持っていけないんだろう…
  • このデータ、どうやって解析すればいいんだろう…

 

その悩みこの無料メルマガで全て解決するかもしれません

 

↓今すぐ無料で論文化までの最短距離を歩く↓

↑無料で論文化に必要な統計を最短で学ぶ↑