データの性質に応じた検定の種類

統計学検定手法は様々である

T検定,Tukey検定,χ二乗検定,分散分析,Logistic回帰分析,Log-rank検定…
統計的な検定手法は,とても多くの種類があります。

 

これらの違いは,どこから来るのでしょうか?
それは,以下の要因により検定手法が決まっています。

 

目的となるデータ(目的変数)がどんな種類であるか(連続量かカテゴリカルか生存時間か),
説明するデータ(説明変数)がどんな種類であるか,
パラメトリックかノンパラメトリックか,
多重性を考慮しているか否か。

 

これらの条件が微妙に違うことで,使用する検定が決まります。

 

 

 

検定手法のまとめ

一例として,目的変数と説明変数が連続量とカテゴリでどのような検定手法が使われるかを,
以下の表に簡単にまとめました。

 

目的変数  説明変数

連続量

カテゴリ

連続量

回帰分析

T検定

分散分析

共分散分析

カテゴリ

Logistic回帰分析

Fisherの正確検定

χ二乗検定

 

 

 

 

解析手法の違いによって,P値も変わってくる

当然ですが,解析手法が違えば,それの結果として出力されるP値も異なってきます。
となると,更なる問題がここで出てきます。

 

それは,有意になる検定手法を恣意的に選ぶことが可能になってしまう
ということです。

 

この問題については,次のページで解説していきたいと思います。

 

 

 

まとめ

目的変数と説明変数がどのような種類であるかによって,検定手法が決まる。
また,パラメトリックかノンパラメトリックか,多重性を考慮しているのかによっても使用される検定が異なる。

 

多くの検定があるということは,恣意的に有意になりやすい検定を選ぶことが出来るという問題が出てくる。

 



data-ad-client="ca-pub-8866234902868600"
data-ad-slot="5243035170"
data-ad-format="auto">



HOME プロフィール お問い合わせ