この記事では「ブートストラップ法とは?医療統計でなぜ使われて欠点や利点はないのかをわかりやすく解説!」ということでお伝えします。
論文を読んでいると、稀に目にすることがあるブートストラップ法。
- そもそもブートストラップ法って何?
- ブートストラップ法を用いるとどんな利点があるの?
- ブートストラップ法には欠点や問題点はないの?
ということが疑問になりますよね。
ぜひこの記事で、上記のような疑問を解決しましょう!
ブートストラップ法とはどんな手法か?
ブートストラップ法とは、得られている推定値の信頼性評価を目的とするシミュレーションの一つ。
シミュレーションといえば乱数で発生させたデータを用いるのが一般的ですが、ブートストラップ法では実際のデータに基づいたシミュレーションをすることが大きな特徴。
ブートストラップ法の手順は?
ブートストラップ法の考え方はシンプルです。
実際に得られているデータがN個だけあったとします。
そのデータから、重複を許してN個のデータをランダムにとってくる、ということをやります。
「重複を許して」というのが重要な部分で、例えば1番目のデータが複数回取られることもあれば、1度も取られることがない、ということもあり得るという意味。
例えば、ブートストラップ法によりX回シミュレーションを実施するとしたら、以下のようなイメージになります。
ブートストラップ法により得られたデータを「ブートストラップ標本」と呼び、今回の例ではX回だけシミュレーションを実施するため、「ブートストラップ標本1・・・ブートストラップ標本X」が作成されます。
繰り返しになりますが、ブートストラップ法では「重複を許す」という特徴があるので、例えばブートストラップ標本1では、データ1が2回選ばれており、データ2は選ばれていない、ということがわかります。
X回だけシミュレーションをすると、推定値(平均値など)がX個算出できることになります。
そのX個の範囲を示すことで推定値の取りうる範囲が示せますね。
通常だと推定値は1つの値でしか表示されませんが、推定値の取りうる範囲を示すことで得られている推定値の信頼性評価を示すことができるということになります。
ブートストラップ法は医療統計でなぜ実施する?
ブートストラップ法は医療統計でなぜ実施するのか。
その理由は繰り返しになりますが、「得られている推定値の信頼性評価」ができるからです。
ブートストラップ法により繰り返し推定値を算出することによって、推定値が取りうる範囲を知ることができるのは大きな利点。
推定値が取りうる範囲を知るという事では95%信頼区間もその一種ですが、95%信頼区間は正規分布を仮定して算出しています。
その仮定すら不要であるという点が、ブートストラップ法と95%信頼区間との違い。
95%信頼区間はパラメトリックな方法、ブートストラップ法はノンパラメトリックな方法、というイメージをしてもいいかと思います。
予測研究では内的妥当性(Internal Validation)で用いられることもある
臨床研究では、診断研究や予後を予測するような目的で実施されることがあります。
その際には「内的妥当性(Internal Validation)」と「外的妥当性(External Validation)」が必要になりますが、内的妥当性(Internal Validation)を目的とする場合にブートストラップ法が使われる場合があります。
ブートストラップ法以外では、クロスバリデーションが用いられることもあります。
ブートストラップ法の欠点と利点は?問題点はあるのか?
一見、すごく良さそうな方法に思えるブートストラップ法。
ブートストラップ法には利点と欠点はあるのでしょうか?
まとめてみましょう。
ブートストラップ法の利点は?
ブートストラップ法の利点はなんといっても、分布を仮定しない解析手法である、ということ。
得られているデータからデータの重複を許してランダムに取ってくる、ということをしているだけなので、非常に単純です。
前提条件がほぼ皆無ですので、解析としてとても単純で、いろんな場面に応用しやすいという点が利点ですね。
例えば、中央値に対しては95%信頼区間の定義がありませんが、ブートストラップ法を用いることで「中央値が取りうる範囲」というものを示すことができます。
ブートストラップ法の欠点や問題点は?
ブートストラップ法には仮定がほぼ無いといっても、一つだけ仮定を置いています。
それは「得られている標本が母集団だとみなす」という仮定。
そのため、データが母集団を適切に反映した標本でなければ、真の母集団を適切に反映できない、という点は理解しておきましょう。
まとめ
この記事では「ブートストラップ法をわかりやすく!なぜ使われて欠点や利点はないのか?」ということでお伝えしました。
- そもそもブートストラップ法って何?
- ブートストラップ法を用いるとどんな利点があるの?
- ブートストラップ法には欠点や問題点はないの?
ということが疑問が解決したのなら幸いです!
コメント