MENU

SPSS で一元配置分散分析に必要なサンプル数を計算する方法

分散分析のサンプルサイズ計算はあまり知られていないが、多くの人に探されている方法である。

SPSSで計算する方法を紹介する。

>>もう統計で悩むのは終わりにしませんか? 

↑期間・数量限定で無料プレゼント中!

目次

分散分析のサンプルサイズ計算はSPSSのどのメニューから実行するか?

メニューは、分析→検定力分析→平均→一元配置分散分析、でたどり着ける。

しかし、開いた窓には、何が書いてあるのか、よくわからずどんな数値を入れるのかさっぱりわからない、といったところではないだろうか。

必要な個所を一つ一つ見ていく。

単一べき乗値とは?

ここには検出力を入力する。

通常は0.8でよい。

単一べき乗値は、Single power valueの翻訳と思われる。

Powerは、べき乗の意味もあるが、ここではべき乗ではなく、検出力だ。

>>もう統計で悩むのは終わりにしませんか? 

↑1万人以上の医療従事者が購読中

指定はCohenのfかイータ2乗を使う

例えば2群の平均値の差であれば、標準偏差で割った標準化した差を効果サイズ(effect size)(効果量とも言う)というが、それと同等の標準化した効果サイズを指定するのがよい。

Cohenのfとイータ(η)2乗が選べる。

この2つが何なのか、どうすればよいかを解説する。

Cohenのfは慣例の値がある

先行研究やパイロット研究の結果などの情報が一切ないために、エイヤで決めなければならない場合は、Cohenが提唱してくれている慣例がある。

  • Small Effect: f=0.1
  • Medium Effect: f=0.25
  • Large Effect: f=0.4

これを使うことができる。

イータ2乗はSPSSで分散分析を実施すると計算される

イータ2乗は、SPSSで分散分析を実行すると自動的に計算される。

例えば、分散分析を実行すると以下のような「分散分析の効果サイズ」と呼ばれる表が出力される。

今回の例では0.136である。

パイロット研究データが利用可能な場合は、このようにイータ2乗が計算できるので、本番の試験のためのサンプルサイズ計算ができるというわけである。

また、すでにデータを取得した後に、改めて、必要サンプルサイズ計算が求められた場合は、分散分析が実行できるので、この値を使うことができる。

イータ2乗は、群間の平方和と全体の平方和の比であるので、先行研究の論文に分散分析表が掲載されていれば、そこから計算できる。

今回の例の分散分析表は以下のとおりである。

ここでグループ間の平方和 614.644 と合計の平方和 4525.386 の比を計算すると、0.1358213と計算され、先ほどのイータ2乗 0.136 に一致する。

> 614.644/4525.386
[1] 0.1358213

このように分散分析表からイータ2乗は計算できる。

ちなみに、イータ η2乗とfの間には、以下のような関係があるので、イータ2乗がわかればfも計算できる。

今回の場合は、ほぼ0.4でLarge Effectくらいであることがわかる。

$$ f = \sqrt{\frac{\eta^2}{1 – \eta^2}} $$

> eta2 <- 0.136
> f <- sqrt(eta2/(1-eta2))
> f
[1] 0.396746

イータ2乗=0.136を入力して、話を進めていく。

群の数とサンプルサイズ比を入力する

その下のセクションで群の数を必要に応じて追加し、ケースの重みというカラムにサンプルサイズ比を入力する。

今回の例は3群なので、追加をクリックし、3群にした。

サンプルサイズ比は、特に意図がない限り、全群同数がよく、3群であれば1:1:1がよい。

ケースの重みに1を入力した後、Tab キーを押すと、OKがクリックできるようになる。

フォーカスのセルが、例えば右に移ることが、入力されたという合図のようだ。

あとはOKをクリックすると計算される。

(ただし、バグなのか、OKをクリックしても計算されないことがあるので、そういう場合は、いったんキャンセルし、もう一度窓を開いて、同じことを入力してOKをクリックすると計算されたりする。このように、何度が実行してみることが必要なようだ)

(また、Cohenのfに何か入力して計算してみて、実行できることを確認した後、イータ2乗に値を入れて計算したり、まず2群で計算しておいて、計算ができることを確認した後、3群に増やして計算してみたり、いろいろと試行錯誤が必要な場合もある)

出力の解釈

検出力の計算結果と、サンプルサイズの計算結果が同時に出力される。

「全体の検定用のグループ サイズ割り振り」というタイトルの表に1群あたりの必要サンプルサイズが表示されている。

今回の例では1群22例、合計で66例必要と計算された。

検出力は80%で計算したわけだが、このサンプルサイズで実際に検定するとした場合の、実際の検出力(SPSSでは検定力と表示されている)が0.811 (81.1%)と計算されている。

ちなみに、今回使用した例題は、各群、17例、26例、29例であり、1群22例必要という条件におおよそあっていたと言える。

まとめ

SPSSで分散分析のサンプルサイズ計算を実行する方法を紹介した。

ポイントは、効果サイズをどのように決めるかである。

まったく見積もれない場合はCohenが提唱した慣例を用いるという方法がある。

先行研究やパイロット研究、すでに取得した研究データが利用可能な場合は、イータ2乗を計算して、それを用いるという方法もある。

なんらか、お役に立てば。

参考書籍・サイト

Jacob Cohen. Statistical Power Analysis for the Behavioral Sciences.

多標本のデータ処理 | 我楽多頓陳館–雑学と統計学の館

SPSSによる分散分析・混合モデル・多重比較の手順

SPSSによる分散分析・混合モデル・多重比較の手順
よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

リサーチクエスチョン探し?データ分析?論文投稿?、、、で、もう悩まない!

第1章臨床研究ではなぜ統計が必要なのか?計画することの重要性
  • 推定ってどんなことをしているの?
  • 臨床研究を計画するってどういうこと?
  • どうにかして標本平均を母平均に近づけられないか?
第2章:研究目的をどれだけ明確にできるのかが重要
  • データさえあれば解析でどうにかなる、という考え方は間違い
  • 何を明らかにしたいのか? という研究目的が重要
  • 研究目的は4種類に分けられる
  • 統計専門家に相談する上でも研究目的とPICOを明確化しておく
第3章:p値で結果が左右される時代は終わりました
  • アメリカ統計協会(ASA)のp値に関する声明で指摘されていること
  • そうは言っても、本当に有意差がなくてもいいの…?
  • なぜ統計専門家はp値を重要視していないのか
  • 有意差がない時に「有意な傾向があった」といってもいい?
  • 統計を放置してしまうと非常にまずい
第4章:多くの人が統計を苦手にする理由
  • 残念ながら、セミナー受講だけで統計は使えません。
  • インプットだけで統計が使えない理由
  • どうやったら統計の判断力が鍛えられるか?
  • 統計は手段なので正解がないため、最適解を判断する力が必要
第5章:統計を使えるようになるために今日から何をすれば良いか?
  • 論文を読んで統計が使えるようになるための5ステップ
第6章:統計を学ぶために重要な環境
  • 統計の3つの力をバランスよく構築する環境

以下のボタンをクリックして、画面に出てくる指示に従って、必要事項を記入してください。

この記事を書いた人

統計 ER ブログ執筆者

元疫学研究者

統計解析が趣味

コメント

コメントする

目次