ウィルコクソンの順位和検定ってどんな検定なの?

今日は、ウィルコクソンの順位和検定について!

ノンパラメトリックな検定では一番目にするのではないかと思います。

でも、ノンパラメトリックって?

何で検定の名前に順位ってついてるの?

そんな素朴な疑問を、詳細に解説しています!!

 

広告

ウィルコクソンの順位和検定って、何を検定しているの?

あなたは連続量データを検定したことがありますか?

もしYesであれば、ウィルコクソンの順位和検定を聞いたことがあるかもしれません。

そう、この検定は連続量データを検定する手法です。

じゃあ、連続量データの検定って、他に何がありましたか?

そう、T検定ですね。

T検定については、こちらのページで解説していますので、ぜひ参考にしてください。

 

一番優しい、医薬品開発に必要な統計学の教本

T検定、分散分析、χ二乗検定・・・。世の中にはたくさんある統計的検定。それを一つ一つ解説しています。…

 

ではウィルコクソンの順位和検定は、T検定と何が違うのか。

結論から言うと、「パラメトリックとノンパラメトリックの違い」です。

T検定はパラメトリックですね。

ということは、ウィルコクソンの順位和検定はノンパラメトリックです。

パラメトリックとノンパラメトリックに関してはこちらのページで解説しています。

 

一番優しい、医薬品開発に必要な統計学の教本

検定とは何でしょうか?P値と有意水準の違いは?結果が良ければそれは真実?検定の便利な点と、安易に検定をする怖さを解説し…

 

ですが、ちょっとだけ復習しましょう。

 

パラメトリックとは?

パラメトリックとは、何かの分布を仮定して検定を実施します。

T検定だと、データが正規分布であることを仮定していますね。

これはどういうことかというと、そのデータがちゃんと正規分布になるデータであれば、有意差を検出しやすいです。

逆に言えば、正規分布でなければ、有意差が出にくい検定です。

一長一短あるんです。

 

ノンパラメトリックとは?

では、ノンパラメトリックは。

その名の通り、パラメトリックじゃない、という意味です。

つまり、分布を何も仮定していない検定ということですね。

これも一長一短あります。

データが正規分布の時には、T検定ほど有意になりにくいです。

ですが、正規分布以外の時には、T検定よりもはるかに有意になりやすい。

パラメトリックとノンパラメトリックは、表と裏のような関係です。

有意になりやすさを表にしてみるとこんな感じです。

 

データの分布

T検定(パラメトリック)

ウィルコクソンの順位和検定(ノンパラメトリック)

正規分布

正規分布ではない

×

 

注目したいのは、ウィルコクソンの順位和検定のオールマイティな性質です。

データが正規分布であっても、正規分布でなくとも、有意になりやすさが一定です。

一方、T検定は正規分布ではない場合に、有意になりにくいという性質があります。

じゃあ、常にノンパラメトリックな検定をすればいいのでは?と思ったかもしれません。

つまり、正規分布ではない場合のリスクを考えて、常にノンパラメトリックな検定をすればいいではないかということです。

 

正解です!!!

実は常にノンパラメトリックな検定をすることでまったく問題がないのです。

これは、日本の生物統計の第一人者である大橋靖男先生(2018年現在、中央大学教授)もセミナーでいっていました。

 

ではなぜT検定をはじめとする、パラメトリックな検定が広く行われているのでしょうか。

それは、計画段階で分布を仮定してサンプル数を決める場合が多いからかなと思います。これは完全に私見ですが。

 

ウィルコクソンの順位和検定の帰無仮説は?

さて、話はウィルコクソンの順位和検定に戻します。検定というからには、ウィルコクソンの順位和検定にも帰無仮説と対立仮説があります。

 

帰無仮説H0:A群の母平均=B群の母平均

対立仮説H1:A群の母平均≠B群の母平均

 

連続量のデータを比較するという点ではT検定と同じなので、帰無仮説と対立仮説はT検定とまったく一緒です。

そのため、有意差が出たときの結論もT検定と一緒で、「A群とB群の母平均が異なる」です。

 

なぜ“順位”なのか?

ウィルコクソンの順位和検定。

なぜ“順位”なのでしょうか。

あなたはわかりますか?

答えは、データを順位に落とし込んでいるからです。

言葉でいってもわかりにくいので、例を出してみます。

 

以下のような2群の体重データがあったとします。1群5例のデータです。

A群

55

63

58

49

71

B群

64

70

61

57

67

 

この10個のデータを、群を無視して小さい順に並べると、このようになります。

順位

体重

1

49

A

2

55

A

3

57

B

4

58

A

5

61

B

6

63

A

7

64

B

8

67

B

9

70

B

10

71

A

 

すると、先ほどの体重のデータは、順位データにするとこのようになります。

A群

2

6

4

1

10

B群

7

9

5

3

8

 

解析に用いるのは、この順位に直したデータです。

順位データを解析に用いるために「順位和検定」と呼ばれています。

この“順位に直す”ことによって、外れ値に左右されないことがみてとれます。

中央値を算出するときに、データを小さいほうから順に並べるという処理がありました。

発想はそれと同様です。

 

たとえば、A群の71kgのデータをみてみましょう。

このデータが仮に150kgであったとしたら、順位は変わらずに10位ですね。

そのため、順位和検定の結果にはまったく影響を与えません。

しかし、71kgと150kgとでは平均値が異なるため、T検定の結果には影響を与えます。

このことからも、ノンパラメトリクな検定が、どのような分布でもオールマイティな性質があるということがわかりますね。

 

名前は違えど同じ検定;マンホイットニーのU検定

ウィルコクソンの順位和検定ですが、実は他の1つの検定と実質同じことをしています。

その検定とは、マンホイットニーのU検定です。

名前は違いますが、やっていることは実質的に同じです。

そのため、どちらの検定であっても、この章で解説している手順と同様であると認識して大丈夫です。

 

まとめ

 1)ウィルコクソンの順位和検定は、母平均を検定するノンパラメトリクな検定である。

 2)データを順位に直してから検定をするため、順位和検定と呼ばれている

 3)マンホイットニーのU検定も、実質的に同じ検定手法である。

統計検定2級対策もできる

無料動画の統計授業

 

 

無料動画で統計を学びませんか?

 

・この数式、何を言っているのか全くわからない・・・ 

・統計を学びたいけど、何から手をつけていいのだろう・・・

・統計検定2級を受験したいけど、どう勉強したら・・・

・もう自力で統計を学ぶのに疲れました・・・

 

あなたはそんな悩みを抱えていませんか?

大丈夫です。

最後の手段があります。

どこにもない、統計の無料メルマガ。