ノンパラメトリック検定とパラメトリック検定とは?意味や種類をわかりやすく

ノンパラメトリック検定とパラメトリック検定とは?意味をわかりやすく簡単に

統計的検定を勉強していると、必ず出てくる「パラメトリック検定」と「ノンパラメトリック検定」。

T検定はパラメトリック検定で、ウィルコクソン順位和検定はノンパラメトリック検定です、と教科書に書いてあります。

・・・で、その2つの違いは何?

ってなりますよね。

今回の記事では、「パラメトリック検定」と「ノンパラメトリック検定」の意味や検定の種類に関して、例を交えてわかりやすく簡単に説明します。

>>もう統計で悩むのは終わりにしませんか? 

↑1万人以上の医療従事者が購読中

目次

パラメトリック検定とはどんな意味なの?

パラメトリック検定とはどんな意味なの?

パラメトリック検定というのは、「事前にデータの分布を仮定している検定」になります。

例えば、パラメトリック検定で一番有名なT検定

T検定の場合、データは正規分布に従っていることが前提になります。

正規分布は、平均値標準偏差が決まればその形が決まります。

言い換えると、平均値標準偏差が正規分布の形を決める重要な要素です。

正規分布における平均値と標準偏差のように、分布を決める時の重要な要素を、パラメータと呼びます

そのため、「平均値と標準偏差は、正規分布のパラメータである」と言うことができます。

T検定がやっていることは、二つの正規分布がどれぐらい離れているのか?を調べているということ。

この特性から、一つ言えることがあります。

T検定は、正規分布に従っていないデータでは、有意になりにくい。

もう少し具体的に言うと、外れ値があった場合に、T検定は有意になりにくいです。

平均値は外れ値にかなり影響を受けます。

そして、計算式の中で平均値を使っている標準偏差も、外れ値にかなり影響を受けます。

パラメトリック検定を用いるのがふさわしい場面

パラメトリック検定は、事前にデータの分布を知っている必要があります。

つまり、パラメトリック検定を用いたい場面は「すでに多くの研究でデータの分布がある程度わかっている場合」です。

例えば、身長や体重などは正規分布に従う事が知られています。

ということは、身長や体重の平均値を比較する時には、パラメトリック検定であるT検定を使えば問題ありません

ノンパラメトリック検定とはどんな意味なの?

ノンパラメトリック検定とはどんな意味なの?

ノンパラメトリック検定とは、パラメトリックじゃない検定です。

つまり、「事前にデータの分布を仮定しない検定」になります。

例えば、ウィルコクソンの順位和検定というのが、ノンパラメトリック検定の一つになります。

この場合、データがどんな分布(正規分布や対数正規分布など、何でも)であっても、有意になりやすさというのは同じになります。

有意になりやすさを表にしてみるとこんな感じです。

データの分布T検定(パラメトリック)ウィルコクソンの順位和検定(ノンパラメトリック)
正規分布
正規分布ではない×

注目したいのは、ウィルコクソンの順位和検定のオールマイティな性質です。

データが正規分布であっても、正規分布でなくとも、有意になりやすさが一定です。

ノンパラメトリック検定の利点は?こんな時に使いやすい例

ノンパラメトリック検定は「事前にデータの分布を考慮しなくても良い」という点でとても便利です。

身長や体重など、すでにそのデータの分布がわかっているデータに関しては、パラメトリックな検定をすればOKです。

しかしながら、例えば新規に作成したアンケートのデータなど、事前にデータがどのような分布になっているのかが想像もできない、というデータも世の中には存在します

その場合には、ノンパラメトリック検定を実施する事がオススメ。

>>もう統計で悩むのは終わりにしませんか? 

↑1万人以上の医療従事者が購読中

ノンパラメトリック検定とパラメトリック検定ではどっちを使えばいいの?使い分けの判断は?

ではパラメトリック検定とノンパラメトリック検定の、どちらを使えばよいか?というのが疑問になると思います。

ですが、そこには答えはありません。

大事な考え方は、「母集団がどのような分布になるか」を考えて決めるということです。

決して「得られたデータに一番フィットするという考え方で検定方法を決めてはいけない」のが重要です。

例えば、身長や体重などは正規分布に従うことが知られています。

そのため、今回の研究で得られているデータが正規分布っぽくなさそうでも、それはたまたまであると考えられ、母集団のデータは正規分布である、と考えることができます。

そのため、パラメトリック検定であるT検定を用いても、その解析手法は間違っているとは言えないのです。

ノンパラメトリック検定とパラメトリック検定まとめ

ノンパラメトリック検定とパラメトリック検定まとめ

パラメトリック検定とノンパラメトリック検定の違いは、「事前にデータの分布を仮定しているかどうか」の違いです。

パラメトリック検定はデータの分布を仮定するため、すでにたくさんの研究がされてデータの分布がわかっている場合に有用です。

またノンパラメトリック検定は、アンケート調査など、新規にデータを取得する場合に特に有効です。

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

リサーチクエスチョン探し?データ分析?論文投稿?、、、で、もう悩まない!

第1章臨床研究ではなぜ統計が必要なのか?計画することの重要性
  • 推定ってどんなことをしているの?
  • 臨床研究を計画するってどういうこと?
  • どうにかして標本平均を母平均に近づけられないか?
第2章:研究目的をどれだけ明確にできるのかが重要
  • データさえあれば解析でどうにかなる、という考え方は間違い
  • 何を明らかにしたいのか? という研究目的が重要
  • 研究目的は4種類に分けられる
  • 統計専門家に相談する上でも研究目的とPICOを明確化しておく
第3章:p値で結果が左右される時代は終わりました
  • アメリカ統計協会(ASA)のp値に関する声明で指摘されていること
  • そうは言っても、本当に有意差がなくてもいいの…?
  • なぜ統計専門家はp値を重要視していないのか
  • 有意差がない時に「有意な傾向があった」といってもいい?
  • 統計を放置してしまうと非常にまずい
第4章:多くの人が統計を苦手にする理由
  • 残念ながら、セミナー受講だけで統計は使えません。
  • インプットだけで統計が使えない理由
  • どうやったら統計の判断力が鍛えられるか?
  • 統計は手段なので正解がないため、最適解を判断する力が必要
第5章:統計を使えるようになるために今日から何をすれば良いか?
  • 論文を読んで統計が使えるようになるための5ステップ
第6章:統計を学ぶために重要な環境
  • 統計の3つの力をバランスよく構築する環境

以下のボタンをクリックして、画面に出てくる指示に従って、必要事項を記入してください。

コメント

コメント一覧 (7件)

コメントする

目次