有意水準と有意差とP値!後出しジャンケンをしないために重要な順番

有意水準と有意差とP値!後出しジャンケンをしないために重要な順番

・有意水準、P値、有意差ってどうやって使い分けるの?

・そもそもこの3つ、何が違うの?

 

有意水準、P値、有意差の3つを正確に使い分けられている人、かなり少ないです。

おそらく、100人いたら1人いるかどうか。

 

だから!

この3つを正確に使い分けるようになれば、めっちゃカッコいい!

後輩に頼られるようになります。

Drから信頼されるようになります。

 

この記事を見れば、5分後には、あなたもそんな人になれます!

有意水準、P値、有意差のピラミッド構造

有意水準、P値、有意差の3つ。

これには実は、順番があります。

順番というか、ピラミッド構造。

私の概念では、こう。

 

言葉にすると、こんな感じです。

有意水準があってP値に意味を持たせる。

P値に意味を持たせることで、有意差というものを作り出す。

 

・・・全然わからない。。

 

そんな、あなたの声が聞こえましたww

でも大丈夫。

わかるようになります。

まずは、一つ一つの用語を整理しましょう。

 

 

有意水準の意味

まずは、ピラミッドの一番下にある有意水準。

「水準」という言葉がついています。

ということは、何かの「基準」ってことは想像できますね。

基準って、皆さんの想像通り。

何かランク付けたい測定値みたいなものがあって、それが基準を上回った時に意味を持たせる。

それと一緒です。

 

例えば、赤点の例。

これはこちらのページで解説していますので、ご参照ください。

 

もう一つの例。

高度肥満の基準。

高度肥満は、BMIが35を上回ったら認定です。

そのため、35が「基準」。

BMIがその基準を上回った時に、高度肥満という意味を持たせる。

 

では話を戻して、有意水準は何の基準か。

そう、「有意」かどうかの基準ですね。

何かが有意水準を下回った時に、「有意差あり」と意味づけする「基準」です。

高度肥満のBMI=35と同じです。

 

有意水準と比べる対象:P値

有意水準が、ある「基準」ということがわかりました。

では、今度は「何が」有意水準を下回れば良いかという問題です。

これはもう、タイトルの通り。

そう、P値です。

 

有意水準>P値

 

この関係が成り立った時に、「有意差あり」と判断できるのです。

 

ちなみに、P値のPってなんの略か分かりますか?

答えは、Probabilityです。

日本語では確率です。

そう、P値って確率のことです。

この辺はこちらのページで解説していますので、ご覧ください。

有意差がある、というのは2パターンある

ちょっと脱線したので、戻ります。

有意水準>P値の時に、有意差がある、という結論を得ることができます。

じゃあですよ。

有意差がある時、実は2パターンでてきませんか?

もう一度見てみましょう。

有意水準>P値

もしかしたら、あなたは私が言いたいことがわかったかもしれません。

では答えにいきましょう。

 

1つは、P値が小さい時。

この時は、有意差あり、と自信を持って言えますね。

では、もう1つ。

有意水準が大きい時。

この時も、有意差ありって言えませんか?

 

(そんなのズルだろ・・・)

(ただのイチャモンじゃないか・・・)

 

そんな声が聞こえてきそうですww

でも、理論上は可能なんです。

暗黙的に有意水準は0.05としていますが、そうじゃなくてもいい。

だって、ただの基準だから。

有意水準を動かしてしまえば、どんなP値でも有意差が出てしまう。

 

だから、ピラミッドの一番下なんです!

有意水準をP値の後に動かしちゃうと、有意差が100%出ちゃうんです!

後出しジャンケンと一緒!

そのため医薬品開発では、有意水準を0.05(5%)にするということが決められています。

正確には両側0.05(5%)何ですけど、両側とか片側についてはこのページで解説していますので、どうぞ。

 

冒頭で「有意水準があってP値に意味を持たせる」と言った意味がわかりましたでしょうか?

ではここまでを、肥満の例を踏まえて表でまとめてみます。

 

 高度肥満有意差あり
基準BMI=35有意水準
基準に当てはめる値BMIP値

 

つまり、有意差って

ここまでで一度、有意差をまとめてみます。

有意差を一言でまとめると、こんな感じ。

「P値が有意水準を下回るほどの差」

これが、正確な説明ですね。

 

・・・全然、イメージできない!

 

そう思った方、正解です。笑

だって、有意差を完全に理解するには、P値を理解しなくちゃいけない。

だから、こちらのページを確認してみてください。

 

P値の補足

そういっても、P値についても補足しておきます。

P値の定義はこうです。

「帰無仮説かでその結果以上(以下)が得られる確率」

・・・また帰無仮説という用語が出てきました。。。

 

めげずに、コイン投げを例にして理解していきましょう。

数式はほとんど出ていませんので。

(ビットコインは投げれないですが。。)

 

コインって、表が出る確率は50%ですよね。

じゃあ、100回コインを投げた時。

50回表が出たら、それは納得できると思います。

これは普通のコインだな、と。

45回表が出たとしても、それはそれで納得できると思います。

そりゃ、たまたま45回になることもあるよ、と。

じゃあ、1回しか表が出なかった時。

「・・・ありえないでしょ!!」って思いませんか?

つまり、表が出る確率を50%だと思っていると、表が1回しか出ないというのはあり得ない。

だから、表が50%のコインではない!

イカサマだーー!!

こう思うのが普通です。

 

この時表が出る確率50%を帰無仮説と言います。

その帰無仮説を考えた時に、表が1回以下しか出ない確率をP値とよびます。

ちなみに、100回中1回しか表が出ない時のP値は、もはや天文学的に小さいです。

 

このコインの例を、統計用語を使ってまとめます。

 

帰無仮説を考えると、その結果が出る確率は、あり得ないほどに小さい。

だから、帰無仮説を棄却して(間違いだと考えて)、有意差ありと結論づける。

 

これが全容です。

わかりましたか?

 

まとめ

有意水準、P値、有意差の3つには順番がある。

この順番を間違えると、いくらでもイカサマができる。

 

有意水準は、有意かどうかを決めるための基準。

普通は0.05

P値は、有意水準と照らし合わせるための数字。

有意水準>P値という結果になった時に、有意差あり、と結論づける。