2群の平均値比較、いわゆるt検定のためのサンプルサイズ計算の際の2群共通の標準偏差の求め方。
2群共通の標準偏差とは、サンプルサイズで重み付けした、標準偏差の重み付け平均のことである。
サンプルサイズ計算のための 2 群共通の標準偏差の計算式
2群共通の標準偏差のもととなる、2群共通の不偏分散とは、以下の式で計算できる。
$$ s^2 = \frac{(n_A – 1) S_A^2 + (n_B – 1) S_B^2}{(n_A – 1) + (n_B -1)} $$
AとBは、それぞれの群の名前である。
$ n_A $, $ n_B $ は、それぞれの群のサンプルサイズである。
$ S_A^2 $, $ S_B^2 $ は、各群の不偏分散である。
計算された $ s^2 $ の平方根を計算すると、2群共通の標準偏差となる。
サンプルサイズ計算のための 2 群共通の標準偏差計算例
先行研究から、以下の情報が得られたとする。
この時の2群共通の標準偏差を計算してみる。
- A群のサンプルサイズが16例、B群のサンプルサイズが21例
- A群の標準偏差が6.5、B群の標準偏差が5.2
このときまず両群の不偏分散を計算すると、それぞれ42.25、27.04と計算される。
> sd <- c(6.5, 5.2)
> sd^2
[1] 42.25 27.04
上記の式に代入して、2群共通の不偏分散を計算する。
まず分子を計算してみる。
> (16-1)*42.25 + (21-1)*27.04
[1] 1174.55
分母は、16-1+21-1 = 35である。
> (16-1)+(21-1)
[1] 35
分子÷分母で、2 群共通の不偏分散が計算できる。
> 1174.55/35
[1] 33.55857
2 群共通の不偏分散の平方根が、2 群共通の標準偏差である。
> sqrt(33.55857)
[1] 5.792976
この場合、小数点以下二桁くらいで、5.79 が2群共通の標準偏差の推定値ということでよいだろう。
もともとが小数点以下一桁だったので、二桁で十分だ。
まとめ
2群の平均値比較、いわゆるt検定のサンプルサイズ計算の際に必要になる2群共通の標準偏差の求め方を解説した。
参考になれば。
追伸
ここまで説明してきて、全部ひっくり返すようで申し訳ないが、実際のところ、必ずしもこれほどまで厳密に計算する必要はない。
大きいほうの標準偏差を共通の標準偏差としておけば、必要サンプルサイズが大きくなるので、より確実に統計学的有意を検出できることになり、それでもよい。
2つの値の中間とか、ちょうど真ん中とかでもよい。
実際、今回計算で求めたサンプルサイズ重み付け平均の5.79は、6.5と5.2の単純平均の5.85と大して変わらない。
要は、だいたいでいいのである。
サンプルサイズ計算とはそういうものである。
参考書籍
新版 無作為化比較試験(サンプルサイズ計算の計算式掲載)
EZR公式マニュアル(EZRは、2群の平均値の比較、いわゆるt検定のためのサンプルサイズ計算が可能)
コメント