ブートストラップ法とは?医療統計でなぜ使われて欠点や利点はないのかをわかりやすく解説!

この記事では「ブートストラップ法とは?医療統計でなぜ使われて欠点や利点はないのかをわかりやすく解説!」ということでお伝えします。

論文を読んでいると、稀に目にすることがあるブートストラップ法。

  • そもそもブートストラップ法って何?
  • ブートストラップ法を用いるとどんな利点があるの?
  • ブートストラップ法には欠点や問題点はないの?

ということが疑問になりますよね。

ぜひこの記事で、上記のような疑問を解決しましょう!

>>もう統計で悩むのは終わりにしませんか? 

↑期間・数量限定で無料プレゼント中!

目次

ブートストラップ法とはどんな手法か?

ブートストラップ法とは、得られている推定値の信頼性評価を目的とするシミュレーションの一つ。

シミュレーションといえば乱数で発生させたデータを用いるのが一般的ですが、ブートストラップ法では実際のデータに基づいたシミュレーションをすることが大きな特徴。

 

ブートストラップ法の手順は?

ブートストラップ法の考え方はシンプルです。

実際に得られているデータがN個だけあったとします。

そのデータから、重複を許してN個のデータをランダムにとってくる、ということをやります。

「重複を許して」というのが重要な部分で、例えば1番目のデータが複数回取られることもあれば、1度も取られることがない、ということもあり得るという意味。

例えば、ブートストラップ法によりX回シミュレーションを実施するとしたら、以下のようなイメージになります。

ブートストラップ法により得られたデータを「ブートストラップ標本」と呼び、今回の例ではX回だけシミュレーションを実施するため、「ブートストラップ標本1・・・ブートストラップ標本X」が作成されます。

繰り返しになりますが、ブートストラップ法では「重複を許す」という特徴があるので、例えばブートストラップ標本1では、データ1が2回選ばれており、データ2は選ばれていない、ということがわかります

 

X回だけシミュレーションをすると、推定値(平均値など)がX個算出できることになります。

そのX個の範囲を示すことで推定値の取りうる範囲が示せますね。

通常だと推定値は1つの値でしか表示されませんが、推定値の取りうる範囲を示すことで得られている推定値の信頼性評価を示すことができるということになります。

 

ブートストラップ法は医療統計でなぜ実施する?

ブートストラップ法は医療統計でなぜ実施するのか。

その理由は繰り返しになりますが、「得られている推定値の信頼性評価」ができるからです。

ブートストラップ法により繰り返し推定値を算出することによって、推定値が取りうる範囲を知ることができるのは大きな利点。

推定値が取りうる範囲を知るという事では95%信頼区間もその一種ですが、95%信頼区間は正規分布を仮定して算出しています。

その仮定すら不要であるという点が、ブートストラップ法と95%信頼区間との違い。

 

95%信頼区間はパラメトリックな方法、ブートストラップ法はノンパラメトリックな方法、というイメージをしてもいいかと思います。

 

予測研究では内的妥当性(Internal Validation)で用いられることもある

臨床研究では、診断研究や予後を予測するような目的で実施されることがあります

その際には「内的妥当性(Internal Validation)」と「外的妥当性(External Validation)」が必要になりますが、内的妥当性(Internal Validation)を目的とする場合にブートストラップ法が使われる場合があります。

ブートストラップ法以外では、クロスバリデーションが用いられることもあります。

 

>>もう統計で悩むのは終わりにしませんか? 

↑1万人以上の医療従事者が購読中

ブートストラップ法の欠点と利点は?問題点はあるのか?

一見、すごく良さそうな方法に思えるブートストラップ法。

ブートストラップ法には利点と欠点はあるのでしょうか?

まとめてみましょう。

 

ブートストラップ法の利点は?

ブートストラップ法の利点はなんといっても、分布を仮定しない解析手法である、ということ。

得られているデータからデータの重複を許してランダムに取ってくる、ということをしているだけなので、非常に単純です。

前提条件がほぼ皆無ですので、解析としてとても単純で、いろんな場面に応用しやすいという点が利点ですね。

 

例えば、中央値に対しては95%信頼区間の定義がありませんが、ブートストラップ法を用いることで「中央値が取りうる範囲」というものを示すことができます。

 

ブートストラップ法の欠点や問題点は?

ブートストラップ法には仮定がほぼ無いといっても、一つだけ仮定を置いています。

それは「得られている標本が母集団だとみなす」という仮定。

そのため、データが母集団を適切に反映した標本でなければ、真の母集団を適切に反映できない、という点は理解しておきましょう。

>>母集団と標本の関係は?

 

まとめ

この記事では「ブートストラップ法をわかりやすく!なぜ使われて欠点や利点はないのか?」ということでお伝えしました。

  • そもそもブートストラップ法って何?
  • ブートストラップ法を用いるとどんな利点があるの?
  • ブートストラップ法には欠点や問題点はないの?

ということが疑問が解決したのなら幸いです!

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

リサーチクエスチョン探し?データ分析?論文投稿?、、、で、もう悩まない!

第1章臨床研究ではなぜ統計が必要なのか?計画することの重要性
  • 推定ってどんなことをしているの?
  • 臨床研究を計画するってどういうこと?
  • どうにかして標本平均を母平均に近づけられないか?
第2章:研究目的をどれだけ明確にできるのかが重要
  • データさえあれば解析でどうにかなる、という考え方は間違い
  • 何を明らかにしたいのか? という研究目的が重要
  • 研究目的は4種類に分けられる
  • 統計専門家に相談する上でも研究目的とPICOを明確化しておく
第3章:p値で結果が左右される時代は終わりました
  • アメリカ統計協会(ASA)のp値に関する声明で指摘されていること
  • そうは言っても、本当に有意差がなくてもいいの…?
  • なぜ統計専門家はp値を重要視していないのか
  • 有意差がない時に「有意な傾向があった」といってもいい?
  • 統計を放置してしまうと非常にまずい
第4章:多くの人が統計を苦手にする理由
  • 残念ながら、セミナー受講だけで統計は使えません。
  • インプットだけで統計が使えない理由
  • どうやったら統計の判断力が鍛えられるか?
  • 統計は手段なので正解がないため、最適解を判断する力が必要
第5章:統計を使えるようになるために今日から何をすれば良いか?
  • 論文を読んで統計が使えるようになるための5ステップ
第6章:統計を学ぶために重要な環境
  • 統計の3つの力をバランスよく構築する環境

以下のボタンをクリックして、画面に出てくる指示に従って、必要事項を記入してください。

コメント

コメントする

目次