フィッシャーの直接確率検定。χ二乗検定と何が違うの?

分割表で出てくる検定は2つです。

それは、χ二乗検定とフィッシャーの直接確率検定です。

今日はそのうちのフィッシャーの直接確率検定について解説していきます!

 

 

広告

やっていることのイメージはχ二乗検定と一緒

フィッシャーの直接確率検定。

T検定とかF検定とかと比べると、やたら長い名前です。

その仰々しい名前から、「なんか難しそう・・・」とあなたは思っているかもしれませんね。

でも、まったく難しくないです!!

だって、やっていることはχ二乗検定と一緒ですから。

詳しくはχ二乗検定のページで見てほしいんですが、念のため復習。

 

一番優しい、医薬品開発に必要な統計学の教本

カテゴリデータの解析では必須の分割表。分割表について分かりやすく解説しています。…

 

χ二乗検定もフィッシャーの直接確率検定も、以下のことをやっています。

  • 結果の分割表から、期待度数を算出した分割表を作成する。
  • この2つの分割表がどれだけ違うかを、数値的に示す。

 

じゃあ何が違うんだ!

あなたはそう思ったことでしょう。

当然ですね。

2つあるなら、どこか違う部分があるはず。

そう思うのは当然です。

 

実はこの2つの検定、ある部分が違います。

「この2つの分割表がどれだけ違うかを、数値的に示す」の数値の算出方法が違う。

ここが違う部分です。

χ二乗検定は、どのように数値を出しているかというと、次の手順で算出しています。

  • χ二乗値を計算する
  • χ二乗値と、χ二乗値の分布表を見比べてP値を算出する

 

つまり、T検定なんかと一緒です。

T検定はT値と呼ばれるものを算出して、それをT分布表と見比べてP値を出します。

一方、フィッシャーの直接確率検定はどうしているか。

その名の通り確率を直接計算しています。

そして、ここで言う「確率」がP値のことです。

ここが違う部分です。

χ二乗検定は、P値を導き出すまでにχ二乗値を経由します。

そのため、近似した計算方法と言えます。

一方でフィッシャーの直接確率検定は、「直接」P値を算出します。

つまり、両者の方法で算出したP値は、多少違うのです。

 

じゃあ、どっちの方法を取ればいいの?

それは分割表のページでお示ししたように、データ数が5以下のセルが一つでもある分割表では、フィッシャーの直接確率検定を推奨します。

 

一番優しい、医薬品開発に必要な統計学の教本

カテゴリデータの解析では必須の分割表。分割表について分かりやすく解説しています。…

 

なぜかというと、χ二乗検定は近似した方法のため、ある程度データ数が多い場合に、ちゃんとしたP値を出してくれるからです。

また、フィッシャーの直接確率検定は、膨大な確率計算をする必要があるため、計算力が必要になります。

現在のPCは高性能になりましたが、それでもデータ数が多い場合にはフィッシャーの直接確率検定は時間がかかります。

その使い分けの目安が、データ数が5以下のセルが1つでもあるかどうかです。

 

まとめ

  • フィッシャーの直接確率検定も、根本的にχ二乗検定とやっていることは同じ。
  • だが、P値を算出するための方法が違う。
  • データ数が5以下のセルが一つでもある場合には、フィッシャーの直接確率検定が推奨される。

統計検定2級対策もできる

無料動画の統計授業

 

 

無料動画で統計を学びませんか?

 

・この数式、何を言っているのか全くわからない・・・ 

・統計を学びたいけど、何から手をつけていいのだろう・・・

・統計検定2級を受験したいけど、どう勉強したら・・・

・もう自力で統計を学ぶのに疲れました・・・

 

あなたはそんな悩みを抱えていませんか?

大丈夫です。

最後の手段があります。

どこにもない、統計の無料メルマガ。