分割表とは一体何者?5分で理解できる分割表の基礎!

あなたは「分割表」という言葉を聞いたことがあるでしょうか?

分割表とは、Wikipediaによると、以下のような定義らしいです。

2つ以上の変数(名義尺度が一般的)の間の関係を記録し分析するための表

分かるような、分からないような。。。

というのが感想ではないでしょうか?

言葉で覚えるより、実際の表を見たほうが早いので、早速見ていきましょう!

 

 

広告

基本の2×2分割表を理解しよう!

例えば、一般的によく見る2×2分割表。

このような表です。

例として、100人の男女に右利きか左利きかを聞いてみた結果の表。

 

男性

女性

右利き

43

44

87

左利き

9

4

13

52

48

100



こんな感じの表、一度は見たことありますね。

なぜこれを2×2分割表というのか。

それは、行と列のカテゴリが、それぞれ2水準(男性と女性、右利きと左利き)で分割されている表だからです。

ということは、もしカテゴリがそれぞれ3水準だったら。

それは3×3分割表と言います。

一般化すると分割表はn×m分割表と呼ばれます。

 

分割表の特徴はこれ

分割表の特徴は、この4つあります。

  1. カテゴリカル変数同士の関係を表している
  2. 一番右の列に、行の各水準(上記の例では右利きと左利き)の合計がある(赤文字)
  3. 一番下の行に、列の各水準(上記の例では男性と女性)の合計がある(青文字)
  4. 右下に、全部の合計がある。

分割表から何を読み取ることができるか?

赤と青の合計を見てみましょう。

まず、男女で大きな差がないのは分かりますね。

52例と48例。

これは、私たちの感覚と一致します。

 

一方で、右利きと左利きの人数は大きく違います。

87例と13例。

これも、私たちの感覚と大枠としては一致しますね。

当然、右利きのほうが左利きよりも多いはずなので。

 

分割表に対応する検定は2つ

この分割表に対応する検定は2つあります。

それは、「χ二乗検定」と「フィッシャーの直接確率検定」です。

 

「χ二乗検定」についてはこちらの記事を参考にしてくださいね。

 

 

「フィッシャーの直接確率検定」についてはこちらの記事を参考にしてくださいね。

 

 

この2つの検定の使い分け、あなたは分かりますか?

よく言われているのは、データの数によっての使い分けです。

データの数が多ければ、χ二乗検定

データの数が少なければ、フィッシャーの直接確率検定。

じゃあ、多いとか少ないって、どう判断するんじゃ!

という、疑問を持ったあなた。

ごもっともです。

 

目安は、データ数が5以下のセルがあれば、少ないと判断してフィッシャーの直接確率検定を使います。

セルというのは、2×2で分けられた4つのカテゴリのことを指します。

例えば、上記の表では、女性の左利きのデータ数は4ですよね。

ですから、データが少ないとしてフィッシャーの直接確率検定を使います。

それ以外は、どちらでもいいです。

χ二乗検定でも、フィッシャーの直接確率検定でも。

まぁでも、χ二乗検定のほうが一般的ですかね。

 

まとめ

  • 分割表とは、2つのカテゴリカル変数の関係を示したもの。
  • 検定としては、カイ二乗検定とフィッシャーの直接確率検定が用いられる。
  • 使い分けは、データ数が5以下のセルがあれば、フィッシャーの直接確率検定を使う。
  • それ以外は、どちらを使ってもいい。

 

統計検定2級対策もできる

無料動画の統計授業

 

 

無料動画で統計を学びませんか?

 

・この数式、何を言っているのか全くわからない・・・ 

・統計を学びたいけど、何から手をつけていいのだろう・・・

・統計検定2級を受験したいけど、どう勉強したら・・・

・もう自力で統計を学ぶのに疲れました・・・

 

あなたはそんな悩みを抱えていませんか?

大丈夫です。

最後の手段があります。

どこにもない、統計の無料メルマガ。