EZRでカイ二乗検定とフィッシャーの正確検定の実施方法！分割表でクロス集計

2022年9月5日

分割表の検定で最も重要なカイ二乗検定。

分割表を解析するのに、とりあえずカイ二乗検定さえわかっておけば最低限は問題ないですね。

今回の記事は、そんなカイ二乗検定に関しての実践編。

EZRを使って実際にカイ二乗検定を実施してみましょう！

カイ二乗検定と同じ手順でフィッシャーの正確確率検定も実施してくれますので、併せてEZRでフィッシャーの正確検定を実施する方法も学んでいきましょう！

↑1万人以上の医療従事者が購読中

EZRでカイ二乗検定を実施するために必要となるデータを読み込む方法

まずは、カイ二乗検定を実施するために必要なデータを解説します。

カイ二乗検定は、分割表を検定する方法の1つでした。

カイ二乗検定のほかに分割表を検定するのは、フィッシャーの正確確率検定でしたね。

カイ二乗検定が分割表を検定する方法ということは、2種類のカテゴリカルデータが必要になります。

で、EZRで解析するためのデータ作成で重要なのが「1症例1行でデータを作成する」こと。

例えば性別データであれば、「男」か「女」というデータが各行に入ります。

（以下のイメージ参照）

このようにデータを作っておけば、解析が可能になります。

そして今回の記事で使うデータについても、1症例1行のデータになっています。

今回は肺がん（Lung Cancer）と喫煙の有無（Smoke）の関連を見ようと思います。

（データは架空のデータです。）

Lung CancerがYであれば肺がんあり、Nであれば肺がんなし、です。

同様にして、SmokeがYであれば喫煙あり、Nであれば喫煙なし、です。

これが80症例分あります。

ではここから、EZRにデータを取り込みます。

まずは、サンプルデータを適切な場所に保存しておきましょう。

EZRを開き、「ファイル」→「データのインポート」→「ファイルまたはクリップボード, URLからテキストデータを読み込む」を選択します。

データセット名は「Chisq」にしましょう（実際はなんでもよい）。

そして「ローカルファイルシステム」と「カンマ」にチェックを入れてOKを押します。

データセットが「Chisq」になっていることを確認し、「表示」を押してデータが正しく表示されれば取り込み完了です。

解析するための準備が整いましたので、早速カイ二乗検定を実施してみましょう。

カイ二乗検定を実施するには、以下の手順で行います。

「統計解析」→「名義変数の解析」→「分割表の作成と群間の比率の比較（Fisherの正確検定）」

行の選択（1つ以上選択）で「Smoke」を選択します。
列の変数（1つ選択）で「Lung Cancer」を選択します。
そして、仮説検定で「カイ2乗検定」にチェックを入れます。
カイ二乗検定の連続性補正は「Yes」にしておきます。
もしパーセント表示も必要であれば、必要な情報のパーセントを表示させましょう。
- Smoke（行で選択した変数）のパーセントが必要であれば「行のパーセント」を選択します。
- Lung Cancer（列で選択した変数）のパーセントが必要であれば「列のパーセント」を選択します。

他は、いじらなくてOKです。