Oops! It appears that you have disabled your Javascript. In order for you to see this page as it is meant to appear, we ask that you please re-enable your Javascript!

サンプルサイズの決め方は?統計的な検出力を保持する計算式

突然ですが、サンプルサイズの決め方を知っていますか?

統計学的検定をする際にとても重要なこと。

それが、サンプルサイズを事前に決めることです。

なぜかというと、統計学的検定とは、事前に検出力を保った上で検定する必要があるから。

そうでなければ、いくらP値が0.05を下回ったところで、その結果は「たまたま」にしか過ぎないからです。

計算式は他の書籍でも書かれているので、今回の記事では、なぜサンプルサイズを決めなければならないのか、そして、サンプルサイズを決めるには何を意識すれば良いのか、をお伝えします。

 

 

スポンサー検索

サンプルサイズとは?なぜ事前に決めなければならないの?

サンプルサイズは、事前に決める必要があることをお伝えしました。

しかし、なぜ事前に決めなければならないのか?という疑問が出てきますよね。

そのために、T検定を例にしてなぜ事前に決めなければならないのかを解説します。

 

サンプルサイズが大きいとP値が小さくなる

T検定でやっていることは、以下の4つの手順です。

 

  1. プラセボ群や実薬群の平均値、標準偏差を算出する
  2. T統計量を算出する
  3. P値を算出する(T統計量が大きいと、P値は小さくなる)
  4. P値が有意水準(α=0.05)を下回っているかどうかを判断する

 

この時、T統計量がどんな計算式で求められるかを確認してみます。

T統計量とは、以下の式です。(Nがサンプルサイズ、SDが標準偏差を示しています)

 

この時、プラセボ群のSDと被験薬群のSDが同じと仮定し、式展開してみます。

すると、以下のような式になります。

 

この式を見ると、3つのことに気づきます。

 

  1. サンプルサイズ(N)を大きくすると、T統計量が大きくなる(つまり、P値が小さくなる)
  2. 群間の差が大きいと、T統計量が大きくなる(つまり、P値が小さくなる)
  3. 標準偏差(SD)が小さいと、T統計量が大きくなる(つまり、P値が小さくなる)

 

そう、P値が小さくなる要素は、群間の差が大きいだけじゃないんです。

サンプルサイズが大きくても、P値は小さくなります。

そのため、サンプルサイズを事前に決めなかった場合に、有意差が出た時。

2つの解釈ができることになります。

 

  1. 群間の差が大きくてP値が小さくなった可能性
  2. サンプルサイズが大きくてP値が小さくなった可能性

 

私たちが得たいのは、1の「群間の差が大きくてP値が小さくなった」という結果です。

しかしながら、サンプルサイズを事前に決めておかないと、P値が小さくなった要因が「群間差がある」と「サンプルサイズが大きい」の2つの可能性が残ってしまうことになってしまうのです。

 

そのため、サンプルサイズを事前に決める理由をまとめます。

 

P値が小さくなった時に、「群間差があってP値が小さくなった」のか「サンプルサイズが大きいためにP値が小さくなったのか」の2つの可能性が残ってしまうため

 

これはぜひ理解してください。

 

スポンサーリンク

サンプルサイズの決め方

サンプルサイズを事前に決めておく重要性を理解しました。

ということで、サンプルサイズの決め方です。

サンプルサイズを決めるためには、4つを決める必要があります

 

  1. 群間の効果の差
  2. ばらつき
  3. αエラー
  4. βエラー

 

逆にいうと、上記の4つを決めてしまえばサンプルサイズは自動で決まります。

そのため、この4つに症例数を加えた5つを五角形に見立てて、症例数を決めるペンタゴンという場合があります。

 

 

どこをどう動かすと、サンプルサイズが変動するのか?

群間の効果の差、ばらつき、αエラー、βエラーの4つを動かせば、サンプルサイズが変動することがわかりました。

では、各4つの要素をどう動かすと、サンプルサイズが多くなるか、を見てみます。

 

 

  1. 群間の効果の差が小さいと、サンプルサイズは多くなる
  2. ばらつきが大きいと、サンプルサイズは多くなる
  3. αエラーが小さいと、サンプルサイズは多くなる
  4. βエラーが小さい(検出力が大きい)と、サンプルサイズは多くなる

 

このような動きになります。

上記の4つの動きに関しては、絶対に覚えておきましょう。

丸暗記でもいいぐらいです。

 

ちなみに、βエラーに関しては、検出力で表現する場合があります。

検出力とは(1-βエラー)で表現できるため、βエラーが小さいというのは、検出力が大きい、と等しいことです

 

 

4つの中で実際に変えられる部分は、薬の開発状況によって変わる

サンプルサイズを決めるのは、群間の効果の差、ばらつき、αエラー、βエラーの4つでした。

そして、それぞれが変化すると、サンプルサイズが大きくなったり小さくなったりします。

 

では、開発費用や開発期間が限られた中で、サンプルサイズをできるだけ小さくするには、どこをどうすれば良いでしょうか?

それは、その薬の開発状況に応じて変化させる必要があります

 

第III相試験であれば、αエラーは5%以下にしなければならないと明確に決まっているため,αエラーを変えることが出来ません

しかし第II相試験であれば、企業リスクを受け入れる形で、αエラーを10%にしてみることも可能です。

 

ですがやはり一番に考えるのは、薬効の効果の差と、そのばらつきを変えることが出来ないか?ということです。

薬効の効果の差を大きくするためには、試験に組み入れる患者を、薬剤が効く集団に限定するように、組み入れ基準や除外基準を決めるということを考えます。

しかし、薬が効く集団だけで試験をするとなると、母集団がどこになるのか、そして一般化可能性を考える必要があります

そうして限定された集団で試験をすると、薬として発売されたとしても投与できる集団が限定されて、結局売り上げが伸びないといったことにつながる可能性が出てきます。

このように、開発コストの面と、一般化可能性の面を天秤に掛けて、常に試験の集団を考えなければいけません。

 

 

サンプルサイズを論文で確認する時は、Methodを確認する

サンプルサイズが事前に決まっているかどうか、論文ではMethodを読むことで確認することが出来ます。

ここでサンプルサイズのことが書いていない論文については、どれだけ素晴らしい結果(P値が小さい結果)であろうと、たまたま出た結果であることが否定できません。

つまり、その試験をもう一度実施したら、全く違った結果が出る可能性があるということです。

なぜなら、前述の通り、本当に薬に効果があったためにP値が小さくなったのか、サンプルサイズが大きかったためにP値が小さくなったのかが分からないためです。

 

 

スポンサーリンク

まとめ

統計的検定を厳密に実施するためには、事前にサンプルサイズを決める必要がある。

サンプルサイズを決めずに得た検定結果は、、本当に薬に効果があったためにP値が小さくなったのか、サンプルサイズが大きかったためにP値が小さくなったのかが分からない。

サンプルサイズを決めるのは、群間の効果の差、ばらつき、αエラー、βエラーの4つである。

統計検定2級の解説付き

無料動画の統計授業

 

 

無料動画で統計を学びませんか?

 

・この数式、何を言っているのか全くわからない・・・ 

・統計を学びたいけど、何から手をつけていいのだろう・・・

・統計検定2級を受験したいけど、どう勉強したら・・・

・もう自力で統計を学ぶのに疲れました・・・

 

あなたはそんな悩みを抱えていませんか?

大丈夫です。

最後の手段があります。

どこにもない、統計の無料メールセミナー。