この記事では、分割表に関して例を用いてわかりやすく解説しています。
基本の2×2分割表(四分表)とはどんなものなのでしょうか。
分割表とはどんな表だろう?
私も初めて「分割表」という文字を目にした時には全くイメージできませんでした。。
分割表とは、Wikipediaによると、以下のような定義らしいです。
2つ以上の変数(名義尺度が一般的)の間の関係を記録し分析するための表。
分かるような、分からないような。。。という感じですよね。
言葉で覚えるより、実際の表を見たほうが理解は早いので、例を用いてわかりやすく説明します!
分割表で必須の検定である「カイ二乗検定」と「フィッシャーの正確確率検定」についても概要を解説します!
分割表の基本である2×2分割表(四分表)とはどんな表?
例えば、一般的によく見る2×2分割表。
このような表です。
例として、100人の男女に右利きか左利きかを聞いてみた結果の表。
男性 | 女性 | 合計 | |
右利き | 43 | 44 | 87 |
左利き | 9 | 4 | 13 |
合計 | 52 | 48 | 100 |
こんな感じの表、一度は見たことありますね。
なぜこれを2×2分割表というのか。
それは、行と列のカテゴリが、それぞれ2水準(男性と女性、右利きと左利き)で分割されている表だからです。
ということは、もしカテゴリがそれぞれどちらも3水準だったら。
それは3×3分割表と言います。
一般化すると分割表はn×m分割表と呼ばれます。
分割表とはこのような特徴を持っている!
分割表の特徴は、この4つあります。
- カテゴリカル変数同士の関係を表している
- 一番右の列に、行の各水準(上記の例では右利きと左利き)の合計がある(赤文字)
- 一番下の行に、列の各水準(上記の例では男性と女性)の合計がある(青文字)
- 右下に、全部の合計がある。
分割表から何を読み取ることができるか?
赤と青の合計を見てみましょう。
まず、男女で大きな差がないのは分かりますね。
52例と48例。
これは、私たちの感覚と一致します。
一方で、右利きと左利きの人数は大きく違います。
87例と13例。
これも、私たちの感覚と大枠としては一致しますね。
当然、右利きのほうが左利きよりも多いはずなので。
分割表に対応する検定は2つある!
この分割表に対応する検定は2つあります。
それは、「χ(カイ)二乗検定」と「フィッシャーの直接確率検定」です。
名前だけは聞いたことありますかね?
分割表の検定では、この2つを理解しておけば、全く問題ありません。
この2つの検定の使い分け、あなたは分かりますか?
よく言われているのは、データの数によっての使い分けです。
データの数が多ければ、χ二乗検定。
データの数が少なければ、フィッシャーの直接確率検定。
じゃあ、多いとか少ないって、どう判断するんじゃ!
という、疑問を持ったあなた。
ごもっともです。
目安は、データ数が5以下のセルがあれば、少ないと判断してフィッシャーの直接確率検定を使います。
セルというのは、2×2で分けられた4つのカテゴリのことを指します。
エクセルの「セル」と同じ意味ですね。
例えば、上記の表では、女性の左利きのデータ数は4ですよね。
ですから、データが少ないとしてフィッシャーの直接確率検定を使います。
それ以外は、どちらでもいいです。
χ二乗検定でも、フィッシャーの直接確率検定でも。
まぁでも、χ二乗検定のほうが一般的ですかね。
なんとなく多くの方が「データが多い場合にはフィッシャーの正確確率検定は使えない」と思っているようですが、そんなことはないです。
「データが少ないときにカイ二乗検定はNG」というだけであって、「データが多い場合でもフィッシャーの正確確率検定は使ってもOK」です。
そのため、常にフィッシャーの正確確率検定を使っておけば問題ない、ということになります。
カイ二乗検定とフィッシャーの正確確率検定は2×2分割表以外でも使える
たまにこのような質問をされることがあります。
「3群あった場合にカイ二乗検定(もしくはフィッシャーの正確確率検定)は実施できますか?」
という質問。
結論から言えば、3群以上あった場合にもカイ二乗検定(もしくはフィッシャーの正確確率検定)は実施可能です。
ただ、結果の解釈の仕方には注意が必要ですので、詳しくはこちらの記事をご覧くださいませ。
>>3群以上の比較にカイ二乗検定を使いたい!エクセルでの計算方法も紹介!
分割表の解析と検定をEZRで実践する
分割表の解析をEZRで実践する方法を、別記事で解説しています。
EZRとは無料の統計ソフトであるRを、SPSSやJMPなどのようにマウス操作だけで解析を行うことができるソフトです。
EZRもRと同様に完全に無料であるため、統計解析を実施する誰もが実践できるソフトになっています。
2019年5月の時点で英文論文での引用回数が2400回を超えているとのことで、論文投稿するための解析ソフトとしても申し分ありません。
これを機に、EZRで統計解析を実施してみてはいかがでしょうか?
分割表に関してまとめ
- 分割表とは、2つのカテゴリカル変数の関係を示したもの。
- 検定としては、カイ二乗検定とフィッシャーの直接確率検定が用いられる。
- 使い分けは、データ数が5以下のセルがあれば、フィッシャーの直接確率検定を使う。
- それ以外は、どちらを使ってもいい。
コメント
コメント一覧 (12件)
[…] 一番優しい、医薬品開発に必要な統計学の教本分割表とは一体何者?5… […]
[…] 一番優しい、医薬品開発に必要な統計学の教本分割表とは一体何者?5… […]
[…] 分割表とは一体何者?5分で理解できる分割表の基礎! […]
[…] 一番優しい、医薬品開発に必要な統計学の教本 分割表とは一体何者?5分で理解できる分割表の基礎! […]
[…] […]
[…] 分割表の検定で最も重要なカイ二乗検定。 […]
[…] >>>分割表とは?例を使ってわかりやすく!2つの検定も理解しよう […]
[…] SPSSでカイ二乗検定を行うには上の表のような分割表(クロス集計表)を用います。 […]
[…] 2×2分割表で使われる検定としては、有名なものが2つあるのはご存知ですか? […]
[…] マクネマー検定は「対応のあるデータ」に対する2*2分割表の検定手法です。 […]
[…] そのためNNTも、分割表の解析の一つ、と言えますね。 […]
[…] 分割表の数値が入力されているテーブル。 […]