傾向スコアマッチングのキャリパーはどのくらいが正解か?
ネット上にある情報をまとめてみた。
マッチングのキャリパーとは
マッチングのキャリパーとは、マッチする症例同士がどのくらいまで離れているのを許容するかという幅である。
例えば年齢をマッチングさせているならば、何歳離れていてもマッチしているとみなすかということである。
EZRでは既定値として傾向スコアの 0.2 SD となっている。
0.2 SD は標準偏差の 0.2 倍という意味で、年齢で言えば、標準偏差が5のサンプルの場合、1歳まで離れていてもマッチしているとみなす。
それでは、この0.2SDは、受け入れられるキャリパーだろうか?
傾向スコアマッチングのキャリパーはどれくらいが一般的か?
傾向スコアマッチングのキャリパーはいくつが標準的だろうか?
傾向スコアの 0.2SDが標準的だろうか?
ググってみた結果を総合すると、古典的には0.25、現在は0.2が推奨されると考えられた。
以下は検索結果でキャリパーが明記されていたサイト。
東北大学大学院医学系研究科 EBM 開発学寄附講座 宮田 敏 先生
http://www.cardio.med.tohoku.ac.jp/2005/newmember/pdf/ms/16_7T.pdf
PS のロジット変換の標準偏差の 20%未満。
(Note: PSはPropensity Scoreの略)
StatGuild
https://www.stats-guild.com/analytics/6879
傾向スコアの標準偏差の0.25倍が目安としてよく用いられます。
和歌山県立医科大学医療データサイエンス学 下川敏雄 先生
https://waidai-csc.jp/updata/2018/08/seminar-igaku-20180126.pdf
Rosenbaum & Rubin(1985)は0.25×SDをキャリパーに設定することを推奨している(0.20を推奨する報告もあるため,0.25~020を推奨している).
東京大学大学院医学系研究科臨床疫学・経済分野教授 康永 秀生 先生
https://www.m3.com/open/clinical/news/article/598423
閾値は、多くが全対象患者の傾向スコアの標準偏差の0.2倍に設定されます。
BellCurve統計WEB
また、キャリパーの上限としてプールした標準偏差の0.05倍を指定しました。この値には0.25や0.1が使用されるようです。
医療経済研究機構(現在は、一般社団法人臨床疫学研究推進機構) 奥村 泰之 先生
https://www.slideshare.net/okumurayasuyuki/ss-43780294
スライド28枚目
傾向スコアの推定値をロジット変換した値の 標準偏差に0.2を乗じた値が推奨(Austin PC: Multivariate Behav Res 46: 399-424, 2011.)
大阪大学大学院人間科学研究科 中澤 渉 先生
https://csrda.iss.u-tokyo.ac.jp/panel/dp/PanelDP_067Nakazawa.pdf
ここでは最近傍キャリパー・マッチングを用いる(Guo and Fraser 2010: 146-147)。問題になるのは,何をもって最近傍と見なすかであるが,本稿では 2 つの基準を当てはめてみることにした。1 つは傾向スコアの標準偏差の 4 分の 1(0.25 倍)の値までの差をマッチングできる許容範囲とするもの,もう 1 つは同様の値の差を 0.1 までとするものである。
京都大学大学院医学研究科 医学統計生物情報学 魚住 龍史 先生
https://www.sas.com/content/dam/SAS/ja_jp/doc/event/sas-user-groups/usergroups2017-a-05.pdf
PDF4枚目に、中下段に記述あり。
Rosenbaum and Rubin (1985)で0.25が推奨され、近年ではAustin(2011)で0.2が多くの状況下でバイアスが小さくなることが示されて、0.2を用いた事例が多数存在する。
まとめ
傾向スコアマッチングのキャリパーとして、普遍的に使われている数値は存在しないと言える。
標準偏差の 0.2 倍だったり、0.25 倍だったり、0.1 倍だったりする。
標準偏差も、傾向スコアの標準偏差だったり、傾向スコアのロジット変換の標準偏差だったりする。
つまり、有意水準5%みたいな、かなり確立された数値は存在しない。
であれば、EZRの既定値どおりにしておくのがよい。
おすすめ書籍
EZR公式マニュアル
コメント