P値ってなに?コイン投げで学ぶP値の性質

あなたは,P値って何なのか,考えたことはあるでしょうか?

以前,参加したことのある統計セミナーで「P値を説明してください」という問題が出たことがあります。

あなたはどう回答しますか?

そのセミナーの中で,面白かった回答がありました。

「0.05を切ったら嬉しいもの」

まぁ確かにな,と思いました。

 

P値ほど、誤解されて使われているものはありません。

とりあえず0.05を下回ったら、何も考えずにOK。

そんな使い方をされていることが多い。

でも、実はそれ以上にP値は深い意味を持っています。

このページでぜひともP値は何かを学んでいきましょう!

 

広告

P値って何?

まずは、P値って何かを考えたことはありますか?

P値。ピーチ。

・・・桃??

 

冗談はさておき、P値は「何かの確率」を示しています。

ちなみにP値の「P」は「Probability」の略です。「確率」ですね。

重要なのは,「何の」確率か,ということです。

 

P値は帰無仮説下で,その結果以上(以下)が出る確率である

正解を先に言いますと、P値は以下の言葉で言い換えることができます。

 

帰無仮説下で,その結果より極端な結果が出る確率である

 

・・・文字にされても,全然わからないと思いますので、コインを例に考えてみましょう。

 

そのコインはイカサマか?

コイントスで,表が出たら1万円をもらえる,裏が出たら1万円を支払う,という場面を想定します。

そしてあなたは,そのコインがイカサマであれば参加しない。

つまり裏が出やすいコインである,ということであれば参加したくないと思っています。

 

では、その「イカサマなコインである」を統計学的に証明していきましょう。

まずは、帰無仮説と対立仮説を考えます。

 

帰無仮説と対立仮説は、この記事を復習しましょう。

一番優しい、医薬品開発に必要な統計学の教本

検定とは何でしょうか?P値と有意水準の違いは?結果が良ければそれは真実?検定の便利な点と、安易に検定をする怖さを解説…

 

今回のコイン投げの場合,帰無仮説と対立仮説はどのようになるでしょうか?

このようになりますね。

 

帰無仮説は「コインはイカサマでない」

対立仮説は「コインはイカサマである」

 

ではここで一つ問題です。

帰無仮説「コインはイカサマでない」という前提に立った場合に,裏(若しくは表)が出る確率はどうなるでしょうか?

帰無仮説を考えている場合、「コインはイカサマではない」という場合を想定しています。

つまり、あなたが普段持っている100円玉を投げた時に、どんな確率で裏(もしくは表)が出るかということです。

 

当然わかりますよね。

帰無仮説「コインはイカサマでない」という前提に立った場合に,裏(若しくは表)が出る確率は1/2

 

10人のコイン投げの結果を観察してみる

そして、このコインがイカサマかどうかを確かめるために,自分より前の10人の結果を調べることにしました。

10人の結果を見てみましょう。

帰無仮説では表が出る確率は1/2であるため、10回中5回は表が出るはずです。

ですが、たまたま表が7回でたり、反対に2回しか出ない時もあります。

 

つまり、10人のコイン投げで、表が出る回数は0-10回があり得ます。

あなたの想像の通り、10回コインを投げたうち、10回表が出ることは稀で、0回表が出ることも稀です。

そんなあなたの考えを確率で表現したのが以下の表です。

表が出る回数

0

1

2

3

4

5

6

7

8

9

10

確率

0.001

0.010

0.044

0.117

0.205

0.246

0.205

0.117

0.044

0.010

0.001

累積確率

0.001

0.011

0.055

0.172

0.377

0.623

0.828

0.945

0.989

0.999

1.000

これは、二項確率というものを計算しています。

想像の通り、10回中5回表が出る確率が24.6%と一番高いです。

一方で、0回や10回は0.1%と、一番小さい確率です。

一番下の行は、累積確率と呼ばれ、左から順に確率を足し合わせたものになります。

例えば2回のところにある累積確率(0.055)は、0回の確率と1回の確率と2回の確率を全て足し合わせた結果になっています。

つまり、0.001+0.010+0.044=0.055です。

 

P値は累積確率

そして,この「累積確率」がP値になります。

・・・たぶん,ぽかーんとしている方が大半かもしれません。。

ですが,そうなのです。

一般化してP値を言葉で置き換えます。

 

P値とは、帰無仮説下(表が出る確率は1/2である)での、その結果より極端な結果が出る確率

 

このP値が0.05より小さければ,想定している仮説(帰無仮説)の下では,その結果が出る確率は0.05以下でしかない。

このコイン投げの例でいうと、「1/2は表が出ると想定しているのに、その結果が出る確率は0.05以下しかない」

そのような結果が出た場合に、想定している仮説が間違っている(=帰無仮説が間違っている)んじゃないか。

と考えます。

つまり、帰無仮説を棄却し,対立仮説を採択するのです。

このコインの例では,表が1回以下である確率が0.011であり,2回以下である確率が0.055です。

そのため,10回分の結果から,表が1回以下であればこのコインはイカサマであると結論付け,ゲームには参加しないという判断を下すという流れです。

 

まとめ

P値は帰無仮説下で,その結果以上(以下)が出る確率である。

つまり,帰無仮説下での確率が0.05を下回った場合,帰無仮説を考えていることが間違っているのではないかと判断して棄却し,対立仮説を採択する。

 

統計検定2級対策もできる

無料動画の統計授業

 

 

無料動画で統計を学びませんか?

 

・この数式、何を言っているのか全くわからない・・・ 

・統計を学びたいけど、何から手をつけていいのだろう・・・

・統計検定2級を受験したいけど、どう勉強したら・・・

・もう自力で統計を学ぶのに疲れました・・・

 

あなたはそんな悩みを抱えていませんか?

大丈夫です。

最後の手段があります。

どこにもない、統計の無料メルマガ。

 

最新情報をチェックしよう!