χ二乗検定とは?数式よりも大事なイメージで分かりやすく解説!

分割表で出てくる検定は2つです。

それは、χ二乗検定とフィッシャーの直接確率検定です。

今日はそのうちのχ二乗検定について解説していきます!

 

 

広告

独立性の検定ともいわれている

χ二乗検定は、独立性の検定ともいわれています。

(独立って言われても意味わからない・・・)

と思うあなた、正解です!

私も初めは全く分かりませんでした。

でも理解すると、文字通りのまんまだなー、と思えるでしょう。

独立を辞書で引くと、このような意味です。

 

  1. 他のものから離れて別になっていること。「母屋から独立した離れ」
  2. 他からの束縛や支配を受けないで、自分の意志で行動すること。「独立の精神」「独立した一個の人間」
  3. 自分の力で生計を営むこと。また、自分で事業を営むこと。「親から独立して一家を構える」「独立して自分の店をもつ」

 

つまり言い換えると、「何かに依存していない」「何かに関連していない」ということです。

じゃあ、今回のχ二乗検定の場合、何に関連していない状態か。

あなたは答えられるでしょうか?

 

答えは、「2つの変数間で関連していない」ということ。

言い換えると「2つの変数が独立している」ということ。

 

次から例を挙げます。

例えば、こんな分割表があったとします。

 

表1:薬剤群とコントロール群で治った人の数

 

治った

治らなかった

合計

薬剤群

13

7

20

コントロール群

5

15

20

合計

18

22

40



薬剤群とコントロール群では1:1(20人:20人)に分けられた。

その結果、疾患が治った人と治らなかった人は、新薬群で13人と7人、コントロール群で5人と15人だった。

こんな結果の分割表ですね。

 

期待度数の表を作る

この時、ある表を作ってみます。

一番右の列と一番下の列の数値から、4カテゴリで関連がなかった時の「期待度数」を算出した表です。

期待度数の算出は以下の通り。

 

例えば薬剤群で治った人。

これは、40人のうち、20人が薬剤群で、しかも治ったのは18人。

だから、40×20/40×18/40=9人が、関連がなかったと仮定した時の、薬剤群で治った人の人数になります。

同様にしてほかのカテゴリの期待度数を計算すると、以下の分割表ができます。

 

表2:表1を基にした期待度数

 

治った

治らなかった

合計

薬剤群

9

11

20

コントロール群

9

11

20

合計

18

22

40



この表2が「2つの変数が独立だった時の分割表」になります。

つまり、χ二乗検定がやっていることはこのように言い換えられます。

 

χ二乗検定とは、表1(観測されたデータでの分割表)と表2(独立である状態を想定した分割表)で、どれだけ違いがあるかを数値的に判断する

 

ちなみにこの表1はP値が0.05を下回るので、独立ではない。

つまり、薬剤群かコントロール群かによって、治るか治らないかが違ってくる。

こんな結論になります。

 

普通の教科書は、ここから数式の説明に入りますね。

普通の教科書だと、ここからχ二乗値の計算方法を書いています。

でも、このページでは数式の解説はやりません。

だって、χ二乗値を必要とする人はどれだけいるでしょうか。

胸を張って言えるのは、統計を専門にしている私でも、χ二乗値を手計算で算出したことはない!

ということです。(胸張れるかわかりませんが・・・)

だから、統計はやっぱり何をやっているかをイメージでとらえられるようになったほうがいいですね。

 

まとめ

  • χ二乗検定は、独立性の検定ともいわれている。
  • χ二乗検定では、以下のことをやっている。
  • 結果の分割表から、期待度数を算出した分割表を作成する。
  • この2つの分割表がどれだけ違うかを、数値的に示す。