MENU

EZR で傾向スコアマッチングのバランス評価プロットを書く方法

傾向スコアマッチングの後に、バランス評価をするためのプロットを EZR で作成したいと考えた場合、どのようにするか

>>もう統計で悩むのは終わりにしませんか? 

↑期間・数量限定で無料プレゼント中!

目次

傾向スコアマッチングのバランス評価プロット

傾向スコアマッチングをした後に、マッチングのバランスを評価するプロットは、傾向スコア自体のバランス評価グラフと共変量のバランス評価グラフがある

共変量のバランス評価グラフは、傾向スコアを作成した際に使用した説明変数(バランスさせたい群変数の共変量と呼ぶ)がバランスしているかを評価するグラフである

これらについて、EZR では、どのように書いていけばよいか、解説する

傾向スコアのバランス評価グラフ

EZR で、傾向スコアを作成したときに自動で出力されるグラフを活用する

重ねて表示する方法と上下に表示する方法の 2 つがある

  • 傾向スコアを作成したときに出力されている R スクリプトの中に propensity.plot で始まる行を探す:
# 例
propensity.plot(group=lalonde$treat, p.score=lalonde$PropensityScore.GLM.1)
  • マッチング後にマッチングしたデータセットの名前(例 lalonde_MP など _MP がつくのが標準)に置き換えて再度実行する:
# 例 
propensity.plot(group=lalonde_MP$treat, p.score=lalonde_MP$PropensityScore.GLM.1)
  • 傾向スコア作成時のグラフがマッチング前のグラフ、マッチング後のグラフは、マッチしている様子を表すグラフになる

  • このグラフはカーネル密度グラフと言い、母集団の形を推測したものになっている

以下、参考記事

これを流用して、傾向スコアの分布を示している

  • 上下に表示したい場合は、side=2 を加筆する:
# 例 
propensity.plot(group=lalonde$treat, p.score=lalonde$PropensityScore.GLM.1, side=2)

>>もう統計で悩むのは終わりにしませんか? 

↑1万人以上の医療従事者が購読中

共変量のバランス評価グラフ

共変量のバランス評価グラフは、EZR だけでは書けないため、EZR の出力をエクセルにペーストして、エクセルでグラフを作る

  • まず、傾向スコアを作成したのちに、標準化差を計算する:グラフと表 → サンプルの背景データのサマリー表の出力 → 傾向スコア作成群別の、年齢、性別、BMI の集計表を作る(標準化差を表示するを Yes にする)

  • 実行すると同時にクリップボードにコピーされているので、そのままエクセルのシートの貼り付ける(ペーストする)
  • これをマッチングしたあとにもう一度行う(貼り付けた後 Ctrl+A → Ctrl+T でテーブル形式にしているので、見た目がカラフルになっている)

  • マッチング前と後の SMD の列を並べて、整理して、グラフにする

SMD の列を並べたところ

整理したところ

グラフにしたところ

できあがりのグラフは、上記のとおり

オレンジがマッチング後の標準化差であるが、re75 という変数以外は、おおむね標準化差は、小さくなっていて、バランス良好と言える

re75 は、検討しなおさないといけないかもしれない

まとめ

EZR で傾向スコアマッチングした後に、群間のバランスが良好であるか確認する図の書き方を紹介した

傾向スコア自体のバランス評価プロットは、スクリプトを少しだけ変更すれば、書くことが可能である

共変量のバランス評価プロットは、エクセルの力を借りて、書くことができる

参考になれば

おすすめ書籍

EZRでやさしく学ぶ統計学 改訂3版 〜EBMの実践から臨床研究まで〜
よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

リサーチクエスチョン探し?データ分析?論文投稿?、、、で、もう悩まない!

第1章臨床研究ではなぜ統計が必要なのか?計画することの重要性
  • 推定ってどんなことをしているの?
  • 臨床研究を計画するってどういうこと?
  • どうにかして標本平均を母平均に近づけられないか?
第2章:研究目的をどれだけ明確にできるのかが重要
  • データさえあれば解析でどうにかなる、という考え方は間違い
  • 何を明らかにしたいのか? という研究目的が重要
  • 研究目的は4種類に分けられる
  • 統計専門家に相談する上でも研究目的とPICOを明確化しておく
第3章:p値で結果が左右される時代は終わりました
  • アメリカ統計協会(ASA)のp値に関する声明で指摘されていること
  • そうは言っても、本当に有意差がなくてもいいの…?
  • なぜ統計専門家はp値を重要視していないのか
  • 有意差がない時に「有意な傾向があった」といってもいい?
  • 統計を放置してしまうと非常にまずい
第4章:多くの人が統計を苦手にする理由
  • 残念ながら、セミナー受講だけで統計は使えません。
  • インプットだけで統計が使えない理由
  • どうやったら統計の判断力が鍛えられるか?
  • 統計は手段なので正解がないため、最適解を判断する力が必要
第5章:統計を使えるようになるために今日から何をすれば良いか?
  • 論文を読んで統計が使えるようになるための5ステップ
第6章:統計を学ぶために重要な環境
  • 統計の3つの力をバランスよく構築する環境

以下のボタンをクリックして、画面に出てくる指示に従って、必要事項を記入してください。

この記事を書いた人

統計 ER ブログ執筆者

元疫学研究者

統計解析が趣味

コメント

コメントする

目次