共分散構造分析(構造方程式モデリング)に必要なサンプルサイズはどのように計算するか?
共分散構造分析に必要なサンプルサイズ計算は何を指標にするか?
共分散構造分析(構造方程式モデリング Structural Equation Modeling, SEM とも言う)に必要なサンプルサイズ計算は何を指標にして計算するのだろうか?
Root Mean Square Error of Approximation (RMSEA) というモデルとデータのずれの指標を基にして計算する。
RMSEAは、0.05より小さいときに当てはまりが良いと言われる。
逆に0.1より大きいときに当てはまりが悪いと言われる。
ほかには、モデルの自由度が必要になる。
自由度は、観測変数の数を n, 構造変数(誤差変数以外の変数)の数を m, 求める係数の数を l とすると以下の式で計算できる。
$$ \frac{n(n + 1)}{2} – (m + l) $$
ただし、この自由度は、第2項の数え方を間違える可能性が高いので、ダミーデータやパイロットデータを用いて、AmosやRなどで実際にSEMを実行して確認するほうがよい。
あとは、いつもの有意水準5%、検出力80%を適用して計算する。
共分散構造分析に必要なサンプルサイズ計算はどのソフトウェアでできるか?
共分散構造分析に必要なサンプルサイズ計算は、Rで実行可能である。
まず、semTools パッケージをインストールする。
install.packages("semTools")
次に、semTools パッケージ内の findRMSEAsamplesize() 関数を使って計算する。
有意水準5%、検出力80%は、デフォルトで設定されているので、指定は不要である。
帰無仮説のRMSEA (rmsea0)、対立仮説のRMSEA (rmseaA)、自由度 (df) の3つを指定するだけである。
RMSEAの上記の基準から、帰無仮説を0.1、棄却されたときに採択する対立仮説を0.05として、自由度が20とすると、以下のように188例必要と計算される。
帰無仮説0.1、対立仮説0.5、自由度30とすると、以下のように141例必要と計算される。
帰無仮説を0.08、対立仮説0.05、自由度30とすると、以下のように319例必要と計算される。
まとめ
共分散構造分析(構造方程式モデリング SEM)に必要なサンプルサイズ計算の方法を紹介した。
最終的なモデルがある程度決まっていて、自由度が計算できるかどうかがカギになる。
サンプルサイズ計算は、研究計画段階の見積もりなので、そこまで正確性にこだわらず、サンプルを集める際のある程度の目安のためと割り切っていいのだと思う。
参考サイト
共分散構造分析(構造方程式モデル)の必要サンプル数
http://fourier.ec.kagawa-u.ac.jp/~hori/spss/semsample.html
共分散構造分析の自由度とは、パス図の検討とは :: 【公式】株式会社アイスタット|統計分析研究所
共分散構造分析(構造方程式モデリング)の適合度についてのメモ
コメント