一、为什么很多人学了 propensity score,仍然分不清自己在估计什么?
因为在因果推断里,方法和 estimand 不是一回事。
同样是做倾向评分加权,你可能估计的是:
- ATE
- ATT
- ATC
这三者不是同一个量的不同算法,而是三个本来就不同的因果问题。
二、ATE、ATT、ATC 分别是什么意思?
设:
T=1:接受治疗,比如起始 GLP-1 receptor agonistsT=0:接受对照,比如起始 SGLT-2 inhibitorsY(1):若接受治疗时的潜在结局Y(0):若接受对照时的潜在结局
1. ATE:average treatment effect
\[ ATE = E[Y(1)-Y(0)] \]
它回答的是:
在整个目标人群中,如果所有人都接受治疗,与如果所有人都接受对照相比,平均会差多少?
平均对象是整个研究总体。
2. ATT:average treatment effect among the treated
\[ ATT = E[Y(1)-Y(0)\mid T=1] \]
它回答的是:
在那些实际上接受了治疗的人中,治疗相对于如果这些同样的人改为接受对照,平均会差多少?
平均对象是treated 人群。
3. ATC:average treatment effect among the controls
\[ ATC = E[Y(1)-Y(0)\mid T=0] \]
它回答的是:
在那些实际上接受了对照的人中,如果他们改为接受治疗,平均会差多少?
平均对象是control 人群。
三、为什么同一项研究里 ATE、ATT、ATC 可能不一样?
因为 treatment effect 往往不是对所有人都相同。
举例来说,如果 GLP-1 对高 BMI 患者效果更强,而现实中高 BMI 患者又更容易被开 GLP-1,那么:
ATT可能比ATE更大ATC可能又和前两者不同
四、SMR weights 是什么?为什么它常对应 ATT?
SMR 指的是 standardized mortality ratio 权重。尽管名字里有 mortality,但在方法学上它并不限于死亡结局,也常用于其他终点的标准化分析。
当目标 estimand 是 ATT 时,一个常见的 SMR weighting 形式是:
- 对 treatment 组:
w=1 - 对 control 组:
w=e(X)/(1-e(X))
其中 e(X) 是 propensity score。
这组权重的含义是:
不改变 treatment 组本身,而把 control 组重加权成“看起来像 treatment 组”的协变量分布。
因此,最终估计的就是 treated population 下的反事实对照结果,也就是 ATT。
五、ATT 为什么在药物流行病学里很常见?
因为很多药物流行病学研究的问题本来就是:
对于那些现实中已经被医生选去用某种药的患者,这种药相对于可替代方案的效果如何?
这恰好对应 ATT 的临床含义。
以 GLP-1 与 SGLT-2 为例:
ATE:适用于所有符合条件的患者ATT:适用于现实中被开 GLP-1 的患者ATC:适用于现实中被开 SGLT-2 的患者
如果医生的处方行为本身就体现了患者异质性,那么 ATT 往往更贴近真实临床决策场景。
六、读论文时,如何快速判断自己看到的是哪一种 estimand?
可以抓住以下关键词。
ATE
- average treatment effect
- effect in the overall eligible population
ATT
- average treatment effect among the treated
- among initiators of drug A
- control group weighted to resemble the treated
ATC
- average treatment effect among controls
- treatment group weighted to resemble controls
如果论文同时出现 SMR weights 和 “among those treated”,几乎可以直接想到:作者的目标大概率是 ATT。
七、Takeaways
因果推断里最容易被忽视的一点是:先明确你在平均谁,再谈如何计算。
ATE:平均到全体ATT:平均到 treatedATC:平均到 controls
而 SMR weights 的典型角色,是把比较组标准化到 treatment 组的协变量分布,从而支持 ATT 的估计。
理解了这一层,读药物流行病学论文时就不容易被一堆术语绕进去。