研究計画を作成するにあたって、決めるべきことの一つにサンプルサイズがあります。
サンプルサイズの決定が大事なのは、サンプルサイズが統計解析の結果に影響してくるからです。
この記事では統計解析ソフトJMPを用いた、サンプルサイズの計算方法を説明していきます。
特に、T検定ベースでのJMPを用いたサンプルサイズ計算、カイ二乗検定ベースでのJMPを用いたサンプルサイズ計算をお伝えします!
サンプルサイズを事前に計算する理由は?JMPではどこから計算できる?
多くの研究では母集団を調査することは難しいため、抽出した標本について調査します。
>>>母集団と標本の関係とは?違いをわかりやすい例を用いて解説
実際に知りたいのは、母集団の性質ですので、標本から推定を行います。
この推定の精度にサンプルサイズが大きく効いてきます。
推定の精度を適切なものにために、適切なサンプルサイズを選択することが必要となります。
>>>サンプルサイズの決め方は?統計的な検出力を保持する計算式
JMPで実験計画の一つであるサンプルサイズを考える
統計解析ソフトJMPにはサンプルサイズなど実験計画に必要なものを決定するツールがついています。
ここでは、統計解析ソフトJMPでサンプルサイズの決めます。
[実験計画(DOE)]>[計画の診断]>[標本サイズ/検出力]をクリックします。
すると、次のウィンドウが出てきます。
今回は、この中から、「2標本平均」と「2標本割合」のサンプルサイズを計算していきます。
ちなみに、サンプルサイズがすでに決まっている場合、どの程度の検出力があるかを調べるときも[実験計画(DOE)]>[計画の診断]>[標本サイズ/検出力]から行うことができます。
JMPを用いて2標本平均でのサンプルサイズの決め方(2群のT検定をベースとしたサンプルサイズ計算)
2標本平均では、2つの標本間で平均が異なることを調べるときのサンプルサイズを計算していきます。
要するにT検定を行うときにどのくらいのサンプルサイズが必要かということです。
>>> T検定とは?帰無仮説と対立仮説を必ず確認!F検定で等分散の確認が必要?
先ほど出たこのウインドウの、[2標本平均]をクリックします。
すると、次の画面に切り替わります。
今回はアルファのところは0.05のままにしておきます。
また、誤差標準偏差を1とします。
ここで重要となる要素は、画面の下にある「検出する差(効果の大きさ)」「標本サイズ(サンプルサイズ)」、「検出力」、3つの値です。
JMPでは、これら3つの値のうち、1つか2つを指定します。
数値をどれか1つだけ入力すると、他の2つの数値の関係を示すプロットが得られます。
数値を2つ入力すると、残りの1つが計算されます。
では検出する差を0.05としてみます。
入力したら、[続行]をクリックします。
すると、上のようなグラフが出現します。
検出する差を0.05としたのですが、これを高い検出力で検出するには10000以上のサンプルサイズが必要だいうことになります。
次に、検出する差を0.05で、検出力を0.9とします。
入力できれば、[続行]をクリックします。
今度は、ウィンドウが出現するのではなく、[標本サイズ]の欄に数字が出てきます。
検出する差を0.05で、検出力を0.9のときは合計で16814のサンプルサイズが必要だとうことになります。
JMPを用いてk標本平均でのサンプルサイズの決め方
k標本平均では、kつの標本間で”少なくとも一つは平均が異なる”ことを調べるときのサンプルサイズを計算していきます。
分散分析の考え方ですね。
先ほど出たこのウインドウの、[k標本平均]をクリックします。
すると、次の画面に切り替わります。
先ほどと違うのは、グループの平均を入力する欄が増えたことです。
今回もアルファのところは0.05のままにしておきます。
また、誤差標準偏差を1とします。
あとは同様です。
画面の下にある「検出する差(効果の大きさ)」「標本サイズ(サンプルサイズ)」、「検出力」、の値のうち、1つか2つを指定します。
数値をどれか1つだけ入力すると、他の2つの数値の関係を示すプロットが得られます。
数値を2つ入力すると、残りの1つが計算されます。
JMPで2標本割合の場合のサンプルサイズの決め方:カイ二乗検定をする場合のサンプルサイズ
2標本割合では、2つの標本間で割合が異なることを調べるときのサンプルサイズを計算していきます。
つまり、カイ二乗検定行うときにどのくらいのサンプルサイズが必要かということです。
>>> カイ二乗検定とは?計算式まで簡単に分かりやすく!分割表の検定
先ほど出たこのウインドウの、[2標本割合]をクリックします。
すると、次の画面に切り替わります。
今回はアルファのところは0.05のままにしておきます。
また、[割合1]、[割合2]はそれぞれの群の期待される割合を入力します。
ここで重要となる要素は、画面の下にある「差の仮説値」「標本サイズ」、「検出力」、3つの値です。
ここでは、「標本サイズ1」と「標本サイズ2」の二つが存在します。
もし、サンプルサイズから検出力を推定するときは、両方を入力します。
JMPでは、3つの値のうち、2つを指定します。
数値を2つ入力すると、残りの1つが計算されます。
では、検出力を0.9とします。
[続行]をクリックすれば、[標本サイズ]の欄に結果が出力されます。
JMPでのサンプルサイズの決め方まとめ
- 2標本平均のサンプルサイズは、[実験計画(DOE)]>[計画の診断]>[標本サイズ/検出力]> [2標本平均]から計算できる
- 「検出する差」、「標本サイズ」、「検出力」、3つの値のうち「検出する差」と「検出力」を選択すると「標本サイズ」が出力される
- 2標本割合のサンプルサイズは、[実験計画(DOE)]>[計画の診断]>[標本サイズ/検出力]> [2標本割合]から計算できる
- 「差の仮説値」「標本サイズ」、「検出力」、3つの値のうち「差の仮説値」と「検出力」を選択すると「標本サイズ」が出力される
株式会社データシードは、SAS社のJMP事業部と提携しています。
統計解析担当者として10年間色々な統計解析ソフトを試した結果、本当に使いやすいと思ったのがJMPでした。
ぜひあなたもJMPの全機能を30日間試せるトライアル版で、データからさらなる情報を導き出せることを実感してください。
コメント