MENU

サンプル数が大きく異なる群間比較はやってもいいのか?

まれな疾患の患者さんのデータと、その疾患を持たない患者さんデータを比較しようとすると、人数が大きく異なる。

まれな疾患はデータが集まりにくい。

人数が小さなグループと大きなグループを比較することは問題ないのか?

>>もう統計で悩むのは終わりにしませんか? 

↑期間・数量限定で無料プレゼント中!

目次

サンプル数が大きく異なる群間比較は適切か?

臨床上、比較的まれな疾患(ある疾患の非定型例)というのは数多く存在する。

臨床研究に必要なサンプルサイズ計算をすると、定型例が10000例、非定型例が100例と見積もられるような状況もある。

たが、このような n にかなり差がある二群間をそのままStudent tやWelchやMann-Whitneyなどで検定してもよいのか?

非定型100例に見合うサンプルを定型例から抽出して二群間を比較検討したほうがよいのでは?という意見もある。

懸念はわからないでもないがサンプル数が大きく異なる群間比較は問題ない

なぜ、このような「お気持ち」が存在するのかを想像してみる。

事実、数学的には、全体の n が決まっているのならば、群の n のバランスが崩れていると統計学的有意に出にくくなる。

逆に、バランスしている(1:1)のときに統計学的有意の検出力が最大になる。

これは、計算上そのようになるから、それ以上でも、それ以下でもない。

ただ、全体の n が変化させられる条件では話が異なる。

今回の非定型例に合わせて、100 例ずつとしたので、検出力は下がる。

それは、全体の n が小さくなり、検出力が下がるという、これまた計算上の話である。

つまり、1:1 はとてもよいバランスだが、それによって、全体の n が小さくなってしまうのは、本末転倒ということである。

>>もう統計で悩むのは終わりにしませんか? 

↑1万人以上の医療従事者が購読中

片群のサンプル数が少ない場合どうすればよいか

注目したケースが少なく、コントロールがふんだんにある場合、マッチングするならば、1:nのマッチングをするとよい。

今回の場合は1:100なので、無駄にコントロールがたくさんあるとも言える。

ただし、マッチングは、1:5を超えても検出力は上がらないことは、計算上わかる。

なので、1:n で大きな コントロール比を設定したマッチングは、労多くして益少なしとなる。

一方で、100例と10000例が同じ質のデータが取れているのであれば、何も考えずそのまま解析すればよい。

わざわざ、サンプル数を少なくするような操作はせずに、そのまま、利用可能なデータすべてを使うのが、もっとも適切である。

まとめ

観察型研究において、サンプル数が異なる群間比較を行うことは、問題ない。

しかしながら、観察型研究において、取得したデータのうち、目的とする症例数が少ないからといって、少ない症例数に合わせた操作(マッチング等)をする必要はない。

全部のデータを使って何ら問題ない。

できるかぎり多くのデータを使うべきだ。

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

リサーチクエスチョン探し?データ分析?論文投稿?、、、で、もう悩まない!

第1章臨床研究ではなぜ統計が必要なのか?計画することの重要性
  • 推定ってどんなことをしているの?
  • 臨床研究を計画するってどういうこと?
  • どうにかして標本平均を母平均に近づけられないか?
第2章:研究目的をどれだけ明確にできるのかが重要
  • データさえあれば解析でどうにかなる、という考え方は間違い
  • 何を明らかにしたいのか? という研究目的が重要
  • 研究目的は4種類に分けられる
  • 統計専門家に相談する上でも研究目的とPICOを明確化しておく
第3章:p値で結果が左右される時代は終わりました
  • アメリカ統計協会(ASA)のp値に関する声明で指摘されていること
  • そうは言っても、本当に有意差がなくてもいいの…?
  • なぜ統計専門家はp値を重要視していないのか
  • 有意差がない時に「有意な傾向があった」といってもいい?
  • 統計を放置してしまうと非常にまずい
第4章:多くの人が統計を苦手にする理由
  • 残念ながら、セミナー受講だけで統計は使えません。
  • インプットだけで統計が使えない理由
  • どうやったら統計の判断力が鍛えられるか?
  • 統計は手段なので正解がないため、最適解を判断する力が必要
第5章:統計を使えるようになるために今日から何をすれば良いか?
  • 論文を読んで統計が使えるようになるための5ステップ
第6章:統計を学ぶために重要な環境
  • 統計の3つの力をバランスよく構築する環境

以下のボタンをクリックして、画面に出てくる指示に従って、必要事項を記入してください。

この記事を書いた人

統計 ER ブログ執筆者

元疫学研究者

統計解析が趣味

コメント

コメントする

目次