Oops! It appears that you have disabled your Javascript. In order for you to see this page as it is meant to appear, we ask that you please re-enable your Javascript!
個々の統計検定の説明

ウィルコクソン検定とは?マンホイットニーU検定やT検定との違いは?

今日は、ウィルコクソンの順位和検定について!

ノンパラメトリックな検定では一番目にするのではないかと思います。

 

  • でも、ノンパラメトリックってそもそも何だろう?
  • マンホイットニーのU検定と何が違うの?
  • T検定と何が違うの?
  • 何で検定の名前に順位ってついてるの?

 

そんな素朴な疑問を、詳細に解説しています!!

 

ウィルコクソンの順位和検定とは?T検定との違いは?

あなたは連続量データを検定したことがありますか?

もしYesであれば、ウィルコクソンの順位和検定を聞いたことがあるかもしれません。

そう、この検定は連続量データを検定する手法です。

じゃあ、連続量データの検定って、他に何がありましたか?

そう、T検定です。

連続量データの検定でT検定は必ず抑えとく必要がありますので、理解しておいてくださいね

 

ではウィルコクソンの順位和検定は、T検定と何が違うのか。

結論から言うと、「パラメトリックとノンパラメトリックの違い」です。

T検定はパラメトリックですね。

ということは、ウィルコクソンの順位和検定はノンパラメトリックです。

パラメトリックとノンパラメトリックの違い、ぜひ理解しておきましょう

ですが、ちょっとだけ復習しましょう。

 

パラメトリックとは?

パラメトリックとは、何かの分布を仮定して検定を実施します。

T検定だと、データが正規分布であることを仮定していますね。

これはどういうことかというと、そのデータがちゃんと正規分布になるデータであれば、有意差を検出しやすいです。

逆に言えば、正規分布でなければ、有意差が出にくい検定です。

一長一短あるんです。

 

ノンパラメトリックとは?

では、ノンパラメトリックは。

その名の通り、パラメトリックじゃない、という意味です。

つまり、分布を何も仮定していない検定ということですね。

これも一長一短あります。

データが正規分布の時には、T検定ほど有意になりにくいです。

ですが、正規分布以外の時には、T検定よりもはるかに有意になりやすい。

パラメトリックとノンパラメトリックは、表と裏のような関係です。

有意になりやすさを表にしてみるとこんな感じです。

 

データの分布 T検定(パラメトリック) ウィルコクソンの順位和検定(ノンパラメトリック)
正規分布
正規分布ではない ×

 

注目したいのは、ウィルコクソンの順位和検定のオールマイティな性質です。

データが正規分布であっても、正規分布でなくとも、有意になりやすさが一定です。

一方、T検定は正規分布ではない場合に、有意になりにくいという性質があります。

じゃあ、常にノンパラメトリックな検定をすればいいのでは?と思ったかもしれません。

つまり、正規分布ではない場合のリスクを考えて、常にノンパラメトリックな検定をすればいいではないかということです。

 

正解です!!!

実は常にノンパラメトリックな検定をすることでまったく問題がないのです。

これは、日本の生物統計の第一人者である大橋靖男先生(2018年現在、中央大学教授)もセミナーでいっていました。

 

ではなぜT検定をはじめとする、パラメトリックな検定が広く行われているのでしょうか。

それは、計画段階で分布を仮定してサンプル数を決める場合が多いからかなと思います。これは完全に私見ですが。

 

 

スポンサーリンク

ウィルコクソンの順位和検定の帰無仮説は?

さて、話はウィルコクソンの順位和検定に戻します。検定というからには、ウィルコクソンの順位和検定にも帰無仮説と対立仮説があります。

 

帰無仮説H0:A群の母平均=B群の母平均

対立仮説H1:A群の母平均≠B群の母平均

 

連続量のデータを比較するという点ではT検定と同じなので、帰無仮説と対立仮説はT検定とまったく一緒です。

そのため、有意差が出たときの結論もT検定と一緒で、「A群とB群の母平均が異なる」です。

 

なぜ“順位”なのか?

ウィルコクソンの順位和検定。

なぜ“順位”なのでしょうか。

あなたはわかりますか?

 

答えは、データを順位に落とし込んでいるからです。

言葉でいってもわかりにくいので、例を出してみます。

 

以下のような2群の体重データがあったとします。1群5例のデータです。

A群 55 63 58 49 71
B群 64 70 61 57 67

 

この10個のデータを、群を無視して小さい順に並べると、このようになります。

順位 体重
1 49 A
2 55 A
3 57 B
4 58 A
5 61 B
6 63 A
7 64 B
8 67 B
9 70 B
10 71 A

 

すると、先ほどの体重のデータは、順位データにするとこのようになります。

A群 2 6 4 1 10
B群 7 9 5 3 8

 

解析に用いるのは、この順位に直したデータです。

順位データを解析に用いるために「順位和検定」と呼ばれています。

この“データを順位に直す”ことによって、外れ値に左右されないことがみてとれます。

中央値を算出するときに、データを小さいほうから順に並べるという処理がありました。

発想はそれと同様です。

 

たとえば、A群の71kgのデータをみてみましょう。

このデータが仮に150kgであったとしたら、順位は変わらずに10位ですね。

そのため、順位和検定の結果にはまったく影響を与えません。

しかし、71kgと150kgとでは平均値が異なるため、T検定の結果には影響を与えます。

このことからも、ノンパラメトリクな検定が、どのような分布でもオールマイティな性質があるということがわかりますね。

 

 

スポンサーリンク

名前は違えど同じ検定;マンホイットニーのU検定

ウィルコクソンの順位和検定ですが、実は他の1つの検定と実質同じことをしています。

その検定とは、マンホイットニーのU検定です。

名前は違いますが、やっていることは実質的に同じです。

そのため、どちらの検定であっても、この章で解説している手順と同様であると認識して大丈夫です。

 

まとめ

1)ウィルコクソンの順位和検定は、母平均を検定するノンパラメトリクな検定である。

2)データを順位に直してから検定をするため、順位和検定と呼ばれている

3)マンホイットニーのU検定も、実質的に同じ検定手法である。

メルマガ登録

統計検定2級の解説付き

無料動画の統計授業

 

 

無料動画で統計を学びませんか?

 

・この数式、何を言っているのか全くわからない・・・ 

・統計を学びたいけど、何から手をつけていいのだろう・・・

・統計検定2級を受験したいけど、どう勉強したら・・・

・もう自力で統計を学ぶのに疲れました・・・

 

あなたはそんな悩みを抱えていませんか?

大丈夫です。

最後の手段があります。

どこにもない、統計の無料メールセミナー。