MENU

【無料プレゼント付き】学会発表・論文投稿に必要な統計を最短で学ぶことができる無料メルマガ

AICとBICの違いは何か?統計解析での特徴比較

統計モデルの当てはまりの指標である、AICとBIC。

違いは何か?

>>もう統計で悩むのは終わりにしませんか? 

↑1万人以上の医療従事者が購読中

目次

AICやBICとは何か?

AICは、Akaike’s Information Criterion 赤池情報量規準の頭文字語、BICは、Bayesian Information Criterion ベイズ情報量規準の頭文字語である。

AICもBICも予測性能に着目したモデルの当てはまりの指標である。

複数の多変量モデルを比較して、最小値のモデルが相対的にもっともすぐれたモデルと判断する。

AICとBICの違いは何か?

AICもBICも二つの項の和から成り立っている式で計算されている。

$$ \mathrm{AIC} = -2 \log L + 2k $$

$$ \mathrm{BIC} = -2 \log L + k \log n $$

一つ目の項は同一で、モデルの対数尤度である。

$ -2 \log L $ の項である。

Lは、尤度(ゆうど)である。

尤度とは、得られたデータをある分布(例えば正規分布)に照らしたときに、その分布から発生したとしたらどのくらいもっともらしいかの度合いである。

そのもっともらしさを最大にするパラメータを探すという方法で、パラメータを推定する方法が最尤推定法と呼ばれていて、実際の計算では対数をとった対数尤度を最大化するパラメータを推定するという形で用いられている。

その対数尤度がなるべく大きいほうがよいモデルと判断される。

計算式では、対数尤度に-2が掛かっているため、最終的な値は小さいほうがより良いモデルとなる。

尤度についてはこちらも参照。

二つ目の項が、AICとBICでは異なっている。

この点が、どのような場合に適するかが異なることになる。

AICでは、パラメータ数(つまり、多変量モデルの独立変数の数)のみであり、パラメータが多すぎると、AICが大きくなり、良いモデルとは言えないことになる。

AICの二項目は、2k で、kはパラメータの数である。

一方で、BICでは、パラメータ数にサンプルサイズが掛かっている。

BICの二項目は、$ k \log n $ で、kはパラメータの数、nはサンプルサイズである。

それゆえ、サンプルサイズがモデルの良しあしに影響してくる。

サンプルサイズが大きくなると、BICの値のなかでサンプルサイズの影響が支配的になってくる。

多変量解析の場合は、ある程度のサンプルサイズをもって解析するのが一般的なので、BICがサンプルサイズに支配されるとなると、細かな変数選択が苦手かもしれない。

AICの発明者、赤池先生は「AICは、有意性がようやく認められる程度のパラメータの取り扱いに注目し、誤差の影響に埋没しそうになるところまでモデル化の可能性を追求している」と述べている。

>>もう統計で悩むのは終わりにしませんか? 

↑1万人以上の医療従事者が購読中

まとめ

統計モデルの当てはまりの良さの規準として、AICとBICを紹介し、その異同について説明した。

特別な理由がない限りAICを使うのが良いと思う。

参考文献

赤池 1996 AICとMDLとBIC

http://www.orsj.or.jp/~archive/pdf/bul/Vol.41_07_375.pdf

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

リサーチクエスチョン探し?データ分析?論文投稿?、、、で、もう悩まない!

第1章臨床研究ではなぜ統計が必要なのか?計画することの重要性
  • 推定ってどんなことをしているの?
  • 臨床研究を計画するってどういうこと?
  • どうにかして標本平均を母平均に近づけられないか?
第2章:研究目的をどれだけ明確にできるのかが重要
  • データさえあれば解析でどうにかなる、という考え方は間違い
  • 何を明らかにしたいのか? という研究目的が重要
  • 研究目的は4種類に分けられる
  • 統計専門家に相談する上でも研究目的とPICOを明確化しておく
第3章:p値で結果が左右される時代は終わりました
  • アメリカ統計協会(ASA)のp値に関する声明で指摘されていること
  • そうは言っても、本当に有意差がなくてもいいの…?
  • なぜ統計専門家はp値を重要視していないのか
  • 有意差がない時に「有意な傾向があった」といってもいい?
  • 統計を放置してしまうと非常にまずい
第4章:多くの人が統計を苦手にする理由
  • 残念ながら、セミナー受講だけで統計は使えません。
  • インプットだけで統計が使えない理由
  • どうやったら統計の判断力が鍛えられるか?
  • 統計は手段なので正解がないため、最適解を判断する力が必要
第5章:統計を使えるようになるために今日から何をすれば良いか?
  • 論文を読んで統計が使えるようになるための5ステップ
第6章:統計を学ぶために重要な環境
  • 統計の3つの力をバランスよく構築する環境

以下のボタンをクリックして、画面に出てくる指示に従って、必要事項を記入してください。

この記事を書いた人

統計 ER ブログ執筆者

元疫学研究者

コメント

コメントする

目次