データを解析しよう

ブートストラップ法をわかりやすく!なぜ使われて欠点や利点はないのか?

この記事では「ブートストラップ法をわかりやすく!なぜ使われて欠点や利点はないのか?」ということでお伝えします。

論文を読んでいると、稀に目にすることがあるブートストラップ法。

  • そもそもブートストラップ法って何?
  • ブートストラップ法を用いるとどんな利点があるの?
  • ブートストラップ法には欠点や問題点はないの?

ということが疑問になりますよね。

ぜひこの記事で、上記のような疑問を解決しましょう!

>>もう統計で悩むのは終わりにしませんか? 

↑1万人以上の医療従事者が購読中

ブートストラップ法とはどんな手法か?

ブートストラップ法とは、得られている推定値の信頼性評価を目的とするシミュレーションの一つ。

シミュレーションといえば乱数で発生させたデータを用いるのが一般的ですが、ブートストラップ法では実際のデータに基づいたシミュレーションをすることが大きな特徴。

 

ブートストラップ法の手順は?

ブートストラップ法の考え方はシンプルです。

実際に得られているデータがN個だけあったとします。

そのデータから、重複を許してN個のデータをランダムにとってくる、ということをやります。

「重複を許して」というのが重要な部分で、例えば1番目のデータが複数回取られることもあれば、1度も取られることがない、ということもあり得るという意味。

例えば、ブートストラップ法によりX回シミュレーションを実施するとしたら、以下のようなイメージになります。

ブートストラップ法により得られたデータを「ブートストラップ標本」と呼び、今回の例ではX回だけシミュレーションを実施するため、「ブートストラップ標本1・・・ブートストラップ標本X」が作成されます。

繰り返しになりますが、ブートストラップ法では「重複を許す」という特徴があるので、例えばブートストラップ標本1では、データ1が2回選ばれており、データ2は選ばれていない、ということがわかります

 

X回だけシミュレーションをすると、推定値(平均値など)がX個算出できることになります。

そのX個の範囲を示すことで推定値の取りうる範囲が示せますね。

通常だと推定値は1つの値でしか表示されませんが、推定値の取りうる範囲を示すことで得られている推定値の信頼性評価を示すことができるということになります。

 

ブートストラップ法はなぜ実施する?

ブートストラップ法はなぜ実施するのか。

その理由は繰り返しになりますが、「得られている推定値の信頼性評価」ができるからです。

ブートストラップ法により繰り返し推定値を算出することによって、推定値が取りうる範囲を知ることができるのは大きな利点。

推定値が取りうる範囲を知るという事では95%信頼区間もその一種ですが、95%信頼区間は正規分布を仮定して算出しています。

その仮定すら不要であるという点が、ブートストラップ法と95%信頼区間との違い。

 

95%信頼区間はパラメトリックな方法、ブートストラップ法はノンパラメトリックな方法、というイメージをしてもいいかと思います。

 

>>もう統計で悩むのは終わりにしませんか? 

↑1万人以上の医療従事者が購読中

ブートストラップ法の欠点と利点は?問題点はあるのか?

一見、すごく良さそうな方法に思えるブートストラップ法。

ブートストラップ法には利点と欠点はあるのでしょうか?

まとめてみましょう。

 

ブートストラップ法の利点は?

ブートストラップ法の利点はなんといっても、分布を仮定しない解析手法である、ということ。

得られているデータからデータの重複を許してランダムに取ってくる、ということをしているだけなので、非常に単純です。

前提条件がほぼ皆無ですので、解析としてとても単純で、いろんな場面に応用しやすいという点が利点ですね。

 

例えば、中央値に対しては95%信頼区間の定義がありませんが、ブートストラップ法を用いることで「中央値が取りうる範囲」というものを示すことができます。

 

ブートストラップ法の欠点や問題点は?

ブートストラップ法には仮定がほぼ無いといっても、一つだけ仮定を置いています。

それは「得られている標本が母集団だとみなす」という仮定。

そのため、データが母集団を適切に反映した標本でなければ、真の母集団を適切に反映できない、という点は理解しておきましょう。

>>母集団と標本の関係は?

 

まとめ

この記事では「ブートストラップ法をわかりやすく!なぜ使われて欠点や利点はないのか?」ということでお伝えしました。

  • そもそもブートストラップ法って何?
  • ブートストラップ法を用いるとどんな利点があるの?
  • ブートストラップ法には欠点や問題点はないの?

ということが疑問が解決したのなら幸いです!

今だけ!いちばんやさしい医療統計の教本を無料で差し上げます

第1章:医学論文の書き方。絶対にやってはいけないことと絶対にやった方がいいこと

第2章:先行研究をレビューし、研究の計画を立てる

第3章:どんな研究をするか決める

第4章:研究ではどんなデータを取得すればいいの?

第5章:取得したデータに最適な解析手法の決め方

第6章:実際に統計解析ソフトで解析する方法

第7章:解析の結果を解釈する

 

もしあなたがこれまでに、何とか統計をマスターしようと散々苦労し、何冊もの統計の本を読み、セミナーに参加してみたのに、それでも統計が苦手なら…

私からプレゼントする内容は、あなたがずっと待ちわびていたものです。

 

↓今すぐ無料で学会発表や論文投稿までに必要な統計を学ぶ↓

↑無料で学会発表や論文投稿に必要な統計を最短で学ぶ↑

COMMENT

メールアドレスが公開されることはありません。 が付いている欄は必須項目です