統計的検定を勉強していると、必ず出てくる「パラメトリック検定」と「ノンパラメトリック検定」。
T検定はパラメトリック検定で、ウィルコクソン順位和検定はノンパラメトリック検定です、と教科書に書いてあります。
・・・で、その2つの違いは何?
ってなりますよね。
今回の記事では、「パラメトリック検定」と「ノンパラメトリック検定」の意味や検定の種類に関して、例を交えてわかりやすく簡単に説明します。
パラメトリック検定とはどんな意味なの?
パラメトリック検定というのは、「事前にデータの分布を仮定している検定」になります。
例えば、パラメトリック検定で一番有名なT検定。
T検定の場合、データは正規分布に従っていることが前提になります。
言い換えると、平均値と標準偏差が正規分布の形を決める重要な要素です。
正規分布における平均値と標準偏差のように、分布を決める時の重要な要素を、パラメータと呼びます。
そのため、「平均値と標準偏差は、正規分布のパラメータである」と言うことができます。
T検定がやっていることは、二つの正規分布がどれぐらい離れているのか?を調べているということ。
この特性から、一つ言えることがあります。
T検定は、正規分布に従っていないデータでは、有意になりにくい。
もう少し具体的に言うと、外れ値があった場合に、T検定は有意になりにくいです。
平均値は外れ値にかなり影響を受けます。
そして、計算式の中で平均値を使っている標準偏差も、外れ値にかなり影響を受けます。
パラメトリック検定を用いるのがふさわしい場面
パラメトリック検定は、事前にデータの分布を知っている必要があります。
つまり、パラメトリック検定を用いたい場面は「すでに多くの研究でデータの分布がある程度わかっている場合」です。
例えば、身長や体重などは正規分布に従う事が知られています。
ということは、身長や体重の平均値を比較する時には、パラメトリック検定であるT検定を使えば問題ありません。
ノンパラメトリック検定とはどんな意味なの?
ノンパラメトリック検定とは、パラメトリックじゃない検定です。
つまり、「事前にデータの分布を仮定しない検定」になります。
例えば、ウィルコクソンの順位和検定というのが、ノンパラメトリック検定の一つになります。
この場合、データがどんな分布(正規分布や対数正規分布など、何でも)であっても、有意になりやすさというのは同じになります。
有意になりやすさを表にしてみるとこんな感じです。
データの分布 | T検定(パラメトリック) | ウィルコクソンの順位和検定(ノンパラメトリック) |
正規分布 | ◎ | ◯ |
正規分布ではない | × | ◯ |
注目したいのは、ウィルコクソンの順位和検定のオールマイティな性質です。
データが正規分布であっても、正規分布でなくとも、有意になりやすさが一定です。
ノンパラメトリック検定の利点は?こんな時に使いやすい例
ノンパラメトリック検定は「事前にデータの分布を考慮しなくても良い」という点でとても便利です。
身長や体重など、すでにそのデータの分布がわかっているデータに関しては、パラメトリックな検定をすればOKです。
しかしながら、例えば新規に作成したアンケートのデータなど、事前にデータがどのような分布になっているのかが想像もできない、というデータも世の中には存在します。
その場合には、ノンパラメトリック検定を実施する事がオススメ。
ノンパラメトリック検定とパラメトリック検定ではどっちを使えばいいの?使い分けの判断は?
ではパラメトリック検定とノンパラメトリック検定の、どちらを使えばよいか?というのが疑問になると思います。
ですが、そこには答えはありません。
大事な考え方は、「母集団がどのような分布になるか」を考えて決めるということです。
決して「得られたデータに一番フィットするという考え方で検定方法を決めてはいけない」のが重要です。
例えば、身長や体重などは正規分布に従うことが知られています。
そのため、今回の研究で得られているデータが正規分布っぽくなさそうでも、それはたまたまであると考えられ、母集団のデータは正規分布である、と考えることができます。
そのため、パラメトリック検定であるT検定を用いても、その解析手法は間違っているとは言えないのです。
ノンパラメトリック検定とパラメトリック検定まとめ
パラメトリック検定とノンパラメトリック検定の違いは、「事前にデータの分布を仮定しているかどうか」の違いです。
パラメトリック検定はデータの分布を仮定するため、すでにたくさんの研究がされてデータの分布がわかっている場合に有用です。
またノンパラメトリック検定は、アンケート調査など、新規にデータを取得する場合に特に有効です。
コメント
コメント一覧 (7件)
[…] パラメトリックとノンパラメトリックの違い、ぜひ理解しておきましょう。 […]
[…] Wilcoxonの符号付順位検定(Wilcoxon signed rank test)は、対応のあるt検定のノンパラメトリック版です。 […]
[…] 上述の通り、クラスカルウォリス(Kruskal-Wallis) 検定は1元配置分散分析に対応したノンパラメトリックな手法です。 […]
[…] 例えば「パラメトリック検定」であれば、データがある分布(例えば正規分布)に従っていると「仮定」して検定が実施されますね。 […]
[…] パラメトリックな方法なのが、Tukey検定とDunnett検定。 […]
[…] イメージ的にはパラメトリック検定であるT検定に似ていますね。 […]
[…] […]