MENU

【無料プレゼント付き】学会発表・論文投稿に必要な統計を最短で学ぶことができる無料メルマガ

カイ二乗検定における効果量

カイ二乗検定は、2つのカテゴリカル変数の間に統計的に有意な関連があるかどうかを判断するのに役立つ手法である。しかし、統計的有意性だけでは、その関連性の「強さ」についてはわからない。そこで重要になるのが効果量である。効果量は、群間の差や変数間の関連性の大きさを定量的に示す指標であり、統計的有意性とは独立して結果の実用的な重要性を評価するために不可欠である。

>>もう統計で悩むのは終わりにしませんか? 

↑1万人以上の医療従事者が購読中

目次

カイ二乗検定の効果量の概要

カイ二乗検定における効果量は、カテゴリカル変数間の関連性の強さを示す。一般的に用いられる効果量として、クラメールのVやファイ係数(ϕ)がある。特に2×2分割表(2つのカテゴリカル変数がそれぞれ2つのカテゴリを持つ場合)の場合、ファイ係数が用いられ、それ以上のサイズの分割表ではクラメールのVが用いられる。これらの効果量は0から1の範囲をとり、値が大きいほど関連性が強いことを示す。

  • ファイ係数 (ϕ): 2×2分割表に特化しており、以下の式で計算される。
    $$ \phi = \sqrt{\frac{\chi^2}{N}} $$
    ​ここで、χ2はカイ二乗値、Nは全体のサンプルサイズ
  • クラメールのV: 2×2分割表だけでなく、より大きな分割表にも適用できる。
    $$ V = \sqrt{\frac{\chi^2}{N \times \min(k – 1, r – 1)}}$$​
    ここで、kは列の数、rは行の数
    2×2分割表の場合、k−1=1, r−1=1となるため、クラメールのVはファイ係数と等しくなる

一般的に、効果量の目安として、Cohen (1988) は以下のような基準を提示している。

  • w(またはϕ、V)= 0.1:小さい効果
  • w(またはϕ、V)= 0.3:中程度の効果
  • w(またはϕ、V)= 0.5:大きい効果

具体例:2群のアウトカム比較

ある食品Aの摂取と特定の良い結果(例えば健康状態の改善)との関連性を調べる研究を計画しているとする。例えば、以下のような割合の分割表が考えられたとする。

良い結果悪い結果
食品 A 摂取群120 (16 %)74 (10 %)
食品 A 非摂取群277 (37%)277 (37 %)

表内の%は、全体のサンプルサイズ 748 に対する割合である。

この場合、食品A摂取群のほうが良い結果に結びつく割合が高く(16% vs 10%)、非摂取群では良い結果と悪い結果の割合が同等(37% vs 37%)である状況を想定している。

>>もう統計で悩むのは終わりにしませんか? 

↑1万人以上の医療従事者が購読中

Rでの計算方法

Rでは、pwrパッケージのES.w2()関数を用いて、指定した割合の分割表に対応する効果量wを計算できる。

pwr パッケージのインストールと読み込み:

もしインストールされていない場合は、まずインストールする。

# install.packages("pwr") # 必要であれば実行
library(pwr)

分割表の作成と効果量の計算:

上記で例示した割合の分割表を作成し、ES.w2()関数に渡す。

# 分割表の割合を設定
# 1列目: 食品A摂取群、2列目: 食品A非摂取群
# 1行目: 良い結果、2行目: 悪い結果
P <- matrix(c(0.16, 0.10, 0.37, 0.37), nrow = 2, byrow = TRUE)

# 効果量 w を計算
ES.w2(P)

実行結果は以下のようになる。

[1] 0.101406

この結果から、効果量w≈0.1 (小さい効果)である。

まとめ

カイ二乗検定における効果量は、単なる統計的有意性だけでなく、変数間の関連性の実質的な強さを理解するために不可欠な指標である。特にクラメールのVファイ係数が用いられ、これらは関連性の大きさを0から1の範囲で示す。

今回の例では、効果量w≈0.1で、小さい効果と計算された。Rのpwrパッケージを使用することで、これらの効果量を容易に計算し、研究デザインにおける実用的な意味合いを検討することができる。効果量を理解し、報告することで、研究結果の解釈をより豊かにし、その知見の重要性をより明確に伝えることができる。

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

リサーチクエスチョン探し?データ分析?論文投稿?、、、で、もう悩まない!

第1章臨床研究ではなぜ統計が必要なのか?計画することの重要性
  • 推定ってどんなことをしているの?
  • 臨床研究を計画するってどういうこと?
  • どうにかして標本平均を母平均に近づけられないか?
第2章:研究目的をどれだけ明確にできるのかが重要
  • データさえあれば解析でどうにかなる、という考え方は間違い
  • 何を明らかにしたいのか? という研究目的が重要
  • 研究目的は4種類に分けられる
  • 統計専門家に相談する上でも研究目的とPICOを明確化しておく
第3章:p値で結果が左右される時代は終わりました
  • アメリカ統計協会(ASA)のp値に関する声明で指摘されていること
  • そうは言っても、本当に有意差がなくてもいいの…?
  • なぜ統計専門家はp値を重要視していないのか
  • 有意差がない時に「有意な傾向があった」といってもいい?
  • 統計を放置してしまうと非常にまずい
第4章:多くの人が統計を苦手にする理由
  • 残念ながら、セミナー受講だけで統計は使えません。
  • インプットだけで統計が使えない理由
  • どうやったら統計の判断力が鍛えられるか?
  • 統計は手段なので正解がないため、最適解を判断する力が必要
第5章:統計を使えるようになるために今日から何をすれば良いか?
  • 論文を読んで統計が使えるようになるための5ステップ
第6章:統計を学ぶために重要な環境
  • 統計の3つの力をバランスよく構築する環境

以下のボタンをクリックして、画面に出てくる指示に従って、必要事項を記入してください。

この記事を書いた人

統計 ER ブログ執筆者

元疫学研究者

コメント

コメントする

目次