頑健性がある(ロバストである)とは統計学でどんな意味かをわかりやすく解説!

頑健性に関する説明

この記事では「統計学で頑健性がある(ロバストである)」ということの意味について考えていきます。

  • 統計学における「頑健性」の意味は?
  • 多変量解析などのモデル解析での頑健性
  • 頑健性を担保するには?

ということが理解できるようになりますよ!

>>もう統計で悩むのは終わりにしませんか? 

↑期間・数量限定で無料プレゼント中!

目次

統計学における「頑健性(ロバスト)」の意味をわかりやすく解説!

まずは統計における「頑健性」の意味を考えていきましょう。

実は統計解析には「仮定」が含まれていることがほとんどです。

 

例えば、最も有名な統計的検定であるT検定は「データが正規分布である」という仮定を持って解析しています。

しかしながら、実際のデータは必ずしも正規分布に当てはまったデータが出てくるとは限らないですよね。

なので、「仮定」を外した時にも同じ結論が得られるかどうかが重要になってくるんです。

具体的に言えば、T検定で実施した結論と同じ結論が、ノンパラメトリック検定であるマンホイットニーのU検定でも得られるのか?という観点が重要。

 

ここで言うところの「同じ結論」とは、「どちらの解析でも有意/有意じゃない」が同じになる、ということです。

パラメトリック検定とノンパラメトリック検定では解析手法が異なるので、得られる結果(P値)は異なりますが、それでも同じ結論(有意/有意じゃない)が得られるのであればその結果には頑健性があることになります。

 

重要なことは「仮定」が正しいか正しくないか、という正解/不正解が重要ではない、ということ。

仮定が正しくても、仮定が正しくなくても、同じ結論が得られることが最も重要だ、という視点です。

 

多変量解析などのモデル解析での頑健性

この「頑健性」の考え方は、統計学的検定だけに限りません。

多変量解析などのモデル解析でも頑健性の考え方は重要です。

なぜなら、多変量解析などのモデル解析でも多くの仮定が含まれていることがあるからです。

例えば、「残差が正規分布している」とか「多変量解析に含んでいる説明変数の数や種類が最適である」といった前提(仮定)があります。

こういった仮定をずらした時にも同じ結論を得られるのか?という、頑健性を考えることが重要。

 

欠測値のあるデータの取り扱いにはかなり強い仮定があることも

また、欠測値のあるデータを扱う時にも、かなりの仮定を含みます。

例えば、LOCF(Last Observation Carried Forward)という単一補完の方法の一つを考えてみます。

LOCF(Last Observation Carried Forward)は、最後に得られたデータで欠測値を補完する方法。

上記のように、12週のデータが欠測だった場合、直前の8週のデータを12週のデータとして補完します。

しかし、欠測じゃなければもしかしたらオレンジの点のようなデータになっていたかもしれません。

このように、LOCFには「最後に得られたデータがずっと続く」という強い仮定があるんです。

だから、欠測値の考え方を変えた解析手法でも実施し、同じ結論を得られるのかという頑健性を確認することが重要です。

 

>>もう統計で悩むのは終わりにしませんか? 

↑1万人以上の医療従事者が購読中

頑健性を担保するには?

じゃあ頑健性を担保するにはどうしたらいいのでしょうか?

方法としては、複数の解析を実施しても同じ結論が得られるかどうかを確認する、ということ。

医学研究では「感度解析(Sensitivity analysis)」が使われています。

 

感度解析とは
感度解析とはメインとなる解析に対して「仮定」をずらしたときにどんな結果になるのか?を確認する解析のこと

 

感度解析の例としては、

  • 多変量解析に含めている説明変数を変える
  • 欠測値の考慮方法を変える
  • 解析対象集団を変える

といったことが考えられますね。

例えばこちらの論文だと、以下のような記載がありました。

多変量解析として「年齢」を含めた解析をメインとしているのですが、感度解析(Sensitivit Analysis)として「年齢」を除外した際に同じような結論(Similar findings)が得られるかどうかを実施しています。

 

このように、仮定を変えた複数の解析を実施し、同じ結論を得られるのであれば頑健性があると言うことができます。

 

まとめ

いかがでしたか?

この記事では「頑健性がある(ロバストである)」ということの意味について考えました。

  • 統計における「頑健性」の意味は?
  • 多変量解析などのモデル解析での頑健性
  • 頑健性を担保するには?

ということが理解できるようになったのなら幸いです!

 

こちらの内容は動画でも解説していますので、併せてご確認くださいませ。

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

リサーチクエスチョン探し?データ分析?論文投稿?、、、で、もう悩まない!

第1章臨床研究ではなぜ統計が必要なのか?計画することの重要性
  • 推定ってどんなことをしているの?
  • 臨床研究を計画するってどういうこと?
  • どうにかして標本平均を母平均に近づけられないか?
第2章:研究目的をどれだけ明確にできるのかが重要
  • データさえあれば解析でどうにかなる、という考え方は間違い
  • 何を明らかにしたいのか? という研究目的が重要
  • 研究目的は4種類に分けられる
  • 統計専門家に相談する上でも研究目的とPICOを明確化しておく
第3章:p値で結果が左右される時代は終わりました
  • アメリカ統計協会(ASA)のp値に関する声明で指摘されていること
  • そうは言っても、本当に有意差がなくてもいいの…?
  • なぜ統計専門家はp値を重要視していないのか
  • 有意差がない時に「有意な傾向があった」といってもいい?
  • 統計を放置してしまうと非常にまずい
第4章:多くの人が統計を苦手にする理由
  • 残念ながら、セミナー受講だけで統計は使えません。
  • インプットだけで統計が使えない理由
  • どうやったら統計の判断力が鍛えられるか?
  • 統計は手段なので正解がないため、最適解を判断する力が必要
第5章:統計を使えるようになるために今日から何をすれば良いか?
  • 論文を読んで統計が使えるようになるための5ステップ
第6章:統計を学ぶために重要な環境
  • 統計の3つの力をバランスよく構築する環境

以下のボタンをクリックして、画面に出てくる指示に従って、必要事項を記入してください。

コメント

コメントする

目次