今日は、ウィルコクソンの順位和検定について!
ウィルコクソンの順位和検定はノンパラメトリックな検定では一番目にするのではないかと思います。
- でも、ノンパラメトリックってそもそも何だろう?
- ウィルコクソンの順位和検定はマンホイットニーのU検定と何が違うの?
- ウィルコクソンの順位和検定はT検定と何が違うの?
- ウィルコクソンの順位和検定は何で検定の名前に順位ってついてるの?
そんな素朴な疑問を、詳細に解説しています!!
ウィルコクソンの順位和検定とは?T検定との違いは?
あなたは連続量データを検定したことがありますか?
もしYesであれば、ウィルコクソンの順位和検定を聞いたことがあるかもしれません。
そう、このウィルコクソンの順位和検定は連続量データを検定する手法です。
じゃあ、連続量データの検定って、他に何がありましたか?
そう、T検定です。
連続量データの検定でT検定は必ず理解しておく必要がありますので、理解しておいてくださいね。
ウィルコクソンの順位和検定とT検定との違い
ではウィルコクソンの順位和検定は、T検定と何が違うのか。
結論から言うと、「パラメトリックとノンパラメトリックの違い」です。
T検定はパラメトリックですね。
ということは、ウィルコクソンの順位和検定はノンパラメトリックです。
パラメトリックとノンパラメトリックの違い、ぜひ理解しておきましょう。
ですが、ちょっとだけ復習しましょう。
パラメトリック検定とは?なぜウィルコクソンの順位和検定はパラメトリックじゃない?
パラメトリックとは、何かの分布を仮定して検定を実施します。
T検定だと、データが正規分布であることを仮定していますね。
これはどういうことかというと、そのデータがちゃんと正規分布になるデータであれば、有意差を検出しやすいです。
逆に言えば、正規分布でなければ、有意差が出にくい検定です。
一長一短あるんです。
ノンパラメトリックとは?ウィルコクソンの順位和検定はノンパラメトリック検定
では、ノンパラメトリックは。
その名の通り、パラメトリックじゃない、という意味です。
つまり、分布を何も仮定していない検定ということですね。
これも一長一短あります。
データが正規分布の時には、T検定ほど有意になりにくいです。
ですが、正規分布以外の時には、T検定よりもはるかに有意になりやすい。
パラメトリックとノンパラメトリックは、表と裏のような関係です。
有意になりやすさを表にしてみるとこんな感じです。
データの分布 | T検定(パラメトリック) | ウィルコクソンの順位和検定(ノンパラメトリック) |
正規分布 | ◎ | ◯ |
正規分布ではない | × | ◯ |
注目したいのは、ウィルコクソンの順位和検定のオールマイティな性質です。
データが正規分布であっても、正規分布でなくとも、有意になりやすさが一定です。
一方、T検定は正規分布ではない場合に、有意になりにくいという性質があります。
じゃあ、常にノンパラメトリックな検定をすればいいのでは?と思ったかもしれません。
つまり、正規分布ではない場合のリスクを考えて、常にノンパラメトリックな検定をすればいいではないかということです。
正解です!!!
常にノンパラメトリックな検定をすることで、多くの場合で「不正解ではない」ことが多いです。
(ただし、研究目的に対して答えを出すような、プライマリーエンドポイントに対する検定では、ちゃんと精査して決めることは重要です。)
ではなぜT検定をはじめとする、パラメトリックな検定が広く行われているのでしょうか。
それは、計画段階で分布を仮定してサンプル数を決める場合が多いからかなと思います。これは完全に私見ですが。
ウィルコクソンの順位和検定の帰無仮説は?
さて、話はウィルコクソンの順位和検定に戻します。検定というからには、ウィルコクソンの順位和検定にも帰無仮説と対立仮説があります。
帰無仮説H0:A群の分布の位置関係=B群の分布の位置関係
対立仮説H1:A群の分布の位置関係≠B群の分布の位置関係
後述しますが、ウィルコクソンの順位和検定は「データを順位」に変換しているため、値そのものでなく「分布全体の位置関係」を見ていることになります。
ウィルコクソンの順位和検定はなぜ“順位”なのか?
ウィルコクソンの順位和検定。
なぜ“順位”なのでしょうか。
あなたはわかりますか?
答えは、データを順位に落とし込んでいるからです。
言葉でいってもわかりにくいので、例を出してみます。
以下のような2群の体重データがあったとします。1群5例のデータです。
A群 | 55 | 63 | 58 | 49 | 71 |
B群 | 64 | 70 | 61 | 57 | 67 |
この10個のデータを、群を無視して小さい順に並べると、このようになります。
順位 | 体重 | 群 |
1 | 49 | A |
2 | 55 | A |
3 | 57 | B |
4 | 58 | A |
5 | 61 | B |
6 | 63 | A |
7 | 64 | B |
8 | 67 | B |
9 | 70 | B |
10 | 71 | A |
すると、先ほどの体重のデータは、順位データにするとこのようになります。
A群 | 2 | 6 | 4 | 1 | 10 |
B群 | 7 | 9 | 5 | 3 | 8 |
解析に用いるのは、この順位に直したデータです。
順位データを解析に用いるために「順位和検定」と呼ばれています。
この“データを順位に直す”ことによって、外れ値に左右されないことがみてとれます。
中央値を算出するときに、データを小さいほうから順に並べるという処理がありました。
発想はそれと同様です。
たとえば、A群の71kgのデータをみてみましょう。
このデータが仮に150kgであったとしたら、順位は変わらずに10位ですね。
そのため、順位和検定の結果にはまったく影響を与えません。
しかし、71kgと150kgとでは平均値が異なるため、T検定の結果には影響を与えます。
このことからも、ノンパラメトリクな検定が、どのような分布でもオールマイティな性質があるということがわかりますね。
名前は違えどウィルコクソンの順位和検定と同じ検定:マンホイットニーのU検定
ウィルコクソンの順位和検定ですが、実は他の1つの検定と実質同じことをしています。
その検定とは、マンホイットニーのU検定です。
名前は違いますが、やっていることは実質的に同じです。
そのため、どちらの検定であっても、この章で解説している手順と同様であると認識して大丈夫です。
ウィルコクソンの順位和検定に関するまとめ
1)ウィルコクソンの順位和検定は、連続データを検定するノンパラメトリクな検定である。
2)データを順位に直してから検定をするため、順位和検定と呼ばれている
3)マンホイットニーのU検定も、実質的に同じ検定手法である。
動画でもウィルコクソンの順位和検定に関して解説していますので、併せてご確認くださいませ。
コメント
コメント一覧 (4件)
[…] >>マンホイットニーのU検定を理解する! […]
マンホィットニーのU検定は、グループ間の検定ですが、2つのグループの個数が違ってもできますか?クラスの男女の数、28人と12人でも、できますか?
ご質問いただきありがとうございます!
結論から言いますと、群間で例数が異なってもウィルコクソン検定はできます。
実際にJMPで解析した例を動画で撮りましたので、ご覧くださいませ。
https://youtu.be/d5mDU6M_u6s
[…] というのも、ウィルコクソンの順位和検定、というのもあるから。 […]