MENU

ロジスティック回帰分析に投入する説明変数の数はいくつまでなら問題ないか

ロジスティック回帰の説明変数の数はいくつ入れてよいのか?

>>もう統計で悩むのは終わりにしませんか? 

↑期間・数量限定で無料プレゼント中!

目次

ロジスティック回帰の説明変数の数

ロジスティック回帰分析をする場合、サンプルサイズによっていくつの説明変数を投入できるか

サンプルサイズ諸論 の記述がもっともクリアでわかりやすい

二項ロジスティック回帰分析のサンプルサイズについては、シミュレーションの結果、従属変数のいずれか少ないカテゴリのサイズが説明変数×10以下であると、結果のバイアス、精度、モデルフィット等問題が生じていることが示された。しかし、少ないカテゴリのサイズが説明変数×10以上では問題がなかったことが示された(Peduzzi et al., 1996)。この論文のインパクトは大きく、昨今でもロジスティック回帰分析のサンプルサイズは説明変数×10以上が必要とされている場合が多い。

Peduzzi et al., 1996 とは、こちらの論文である

A simulation study of the number of events per variable in logistic regression analysis

著者らは、モンテカルロシミュレーションを用いて、ロジスティック回帰分析における、説明変数の数に対するイベントの数の影響を評価した

「少ないカテゴリ」というのは、もしイベントあり症例よりもイベントなし症例のほうが少なかった場合、イベントなし症例のことを指している

We performed a Monte Carlo study to evaluate the effect of the number of events per variable (EPV) analyzed in logistic regression analysis.

説明変数の数に対するイベントの数が 10 以上であった場合、大きな問題は起きなかった

一方で、10 未満であった場合、偏回帰係数が、プラスにもマイナスにもバイアスを生じた (以下略)

For EPV values of 10 or greater, no major problems occurred. For EPV values less than 10, however, the regression coefficients were biased in both positive and negative directions; …

ということで、説明変数の数に対するアウトカムにおけるイベント数が 10 倍以上あれば、大きな問題は生じず、問題ないと言える

つまり、10 個の説明変数を投入したければ、少なくともアウトカムにおいてイベントが 100 例生じている必要があるという意味である

まとめ

ロジスティック回帰の説明変数の数について、シミュレーション結果に基づく適切な数について解説した

アウトカムのイベントあり・なし症例数のうち、少ないほうの症例数の 10 分の 1 程度にしておくと、大きな問題が生じないと言える

参考になれば

>>もう統計で悩むのは終わりにしませんか? 

↑1万人以上の医療従事者が購読中

参考文献

サンプルサイズ諸論

A simulation study of the number of events per variable in logistic regression analysis

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

リサーチクエスチョン探し?データ分析?論文投稿?、、、で、もう悩まない!

第1章臨床研究ではなぜ統計が必要なのか?計画することの重要性
  • 推定ってどんなことをしているの?
  • 臨床研究を計画するってどういうこと?
  • どうにかして標本平均を母平均に近づけられないか?
第2章:研究目的をどれだけ明確にできるのかが重要
  • データさえあれば解析でどうにかなる、という考え方は間違い
  • 何を明らかにしたいのか? という研究目的が重要
  • 研究目的は4種類に分けられる
  • 統計専門家に相談する上でも研究目的とPICOを明確化しておく
第3章:p値で結果が左右される時代は終わりました
  • アメリカ統計協会(ASA)のp値に関する声明で指摘されていること
  • そうは言っても、本当に有意差がなくてもいいの…?
  • なぜ統計専門家はp値を重要視していないのか
  • 有意差がない時に「有意な傾向があった」といってもいい?
  • 統計を放置してしまうと非常にまずい
第4章:多くの人が統計を苦手にする理由
  • 残念ながら、セミナー受講だけで統計は使えません。
  • インプットだけで統計が使えない理由
  • どうやったら統計の判断力が鍛えられるか?
  • 統計は手段なので正解がないため、最適解を判断する力が必要
第5章:統計を使えるようになるために今日から何をすれば良いか?
  • 論文を読んで統計が使えるようになるための5ステップ
第6章:統計を学ぶために重要な環境
  • 統計の3つの力をバランスよく構築する環境

以下のボタンをクリックして、画面に出てくる指示に従って、必要事項を記入してください。

この記事を書いた人

統計 ER ブログ執筆者

元疫学研究者

統計解析が趣味

コメント

コメントする

目次