まれな疾患の患者さんのデータと、その疾患を持たない患者さんデータを比較しようとすると、人数が大きく異なる。
まれな疾患はデータが集まりにくい。
人数が小さなグループと大きなグループを比較することは問題ないのか?
サンプル数が大きく異なる群間比較は適切か?
臨床上、比較的まれな疾患(ある疾患の非定型例)というのは数多く存在する。
臨床研究に必要なサンプルサイズ計算をすると、定型例が10000例、非定型例が100例と見積もられるような状況もある。
たが、このような n にかなり差がある二群間をそのままStudent tやWelchやMann-Whitneyなどで検定してもよいのか?
非定型100例に見合うサンプルを定型例から抽出して二群間を比較検討したほうがよいのでは?という意見もある。
懸念はわからないでもないがサンプル数が大きく異なる群間比較は問題ない
なぜ、このような「お気持ち」が存在するのかを想像してみる。
事実、数学的には、全体の n が決まっているのならば、群の n のバランスが崩れていると統計学的有意に出にくくなる。
逆に、バランスしている(1:1)のときに統計学的有意の検出力が最大になる。
これは、計算上そのようになるから、それ以上でも、それ以下でもない。
ただ、全体の n が変化させられる条件では話が異なる。
今回の非定型例に合わせて、100 例ずつとしたので、検出力は下がる。
それは、全体の n が小さくなり、検出力が下がるという、これまた計算上の話である。
つまり、1:1 はとてもよいバランスだが、それによって、全体の n が小さくなってしまうのは、本末転倒ということである。
片群のサンプル数が少ない場合どうすればよいか
注目したケースが少なく、コントロールがふんだんにある場合、マッチングするならば、1:nのマッチングをするとよい。
今回の場合は1:100なので、無駄にコントロールがたくさんあるとも言える。
ただし、マッチングは、1:5を超えても検出力は上がらないことは、計算上わかる。
なので、1:n で大きな コントロール比を設定したマッチングは、労多くして益少なしとなる。
一方で、100例と10000例が同じ質のデータが取れているのであれば、何も考えずそのまま解析すればよい。
わざわざ、サンプル数を少なくするような操作はせずに、そのまま、利用可能なデータすべてを使うのが、もっとも適切である。
まとめ
観察型研究において、サンプル数が異なる群間比較を行うことは、問題ない。
しかしながら、観察型研究において、取得したデータのうち、目的とする症例数が少ないからといって、少ない症例数に合わせた操作(マッチング等)をする必要はない。
全部のデータを使って何ら問題ない。
できるかぎり多くのデータを使うべきだ。
コメント