因果 estimand

causal inference

epidemiology

estimands

propensity score

smr weights

att

ate

Understanding different causal estimands (ATE, ATT, ATC) and their implications.

Author

Zhen Lu

Published

Friday, April 3, 2026

一、为什么很多人学了 propensity score，仍然分不清自己在估计什么？

因为在因果推断里，方法和 estimand 不是一回事。

同样是做倾向评分加权，你可能估计的是：

这三者不是同一个量的不同算法，而是三个本来就不同的因果问题。

二、ATE、ATT、ATC 分别是什么意思？

设：

T=1：接受治疗，比如起始 GLP-1 receptor agonists
T=0：接受对照，比如起始 SGLT-2 inhibitors
Y(1)：若接受治疗时的潜在结局
Y(0)：若接受对照时的潜在结局

1. ATE：average treatment effect

\[ ATE = E[Y(1)-Y(0)] \]

它回答的是：

在整个目标人群中，如果所有人都接受治疗，与如果所有人都接受对照相比，平均会差多少？

平均对象是整个研究总体。

2. ATT：average treatment effect among the treated

\[ ATT = E[Y(1)-Y(0)\mid T=1] \]

它回答的是：

在那些实际上接受了治疗的人中，治疗相对于如果这些同样的人改为接受对照，平均会差多少？

平均对象是treated 人群。

3. ATC：average treatment effect among the controls

\[ ATC = E[Y(1)-Y(0)\mid T=0] \]

它回答的是：

在那些实际上接受了对照的人中，如果他们改为接受治疗，平均会差多少？

平均对象是control 人群。

三、为什么同一项研究里 ATE、ATT、ATC 可能不一样？

因为 treatment effect 往往不是对所有人都相同。

举例来说，如果 GLP-1 对高 BMI 患者效果更强，而现实中高 BMI 患者又更容易被开 GLP-1，那么：

ATT 可能比 ATE 更大
ATC 可能又和前两者不同

四、SMR weights 是什么？为什么它常对应 ATT？

SMR 指的是 standardized mortality ratio 权重。尽管名字里有 mortality，但在方法学上它并不限于死亡结局，也常用于其他终点的标准化分析。

当目标 estimand 是 ATT 时，一个常见的 SMR weighting 形式是：

对 treatment 组：w=1
对 control 组：w=e(X)/(1-e(X))

其中 e(X) 是 propensity score。

这组权重的含义是：

不改变 treatment 组本身，而把 control 组重加权成”看起来像 treatment 组”的协变量分布。

因此，最终估计的就是 treated population 下的反事实对照结果，也就是 ATT。

五、ATT 为什么在药物流行病学里很常见？

因为很多药物流行病学研究的问题本来就是：

对于那些现实中已经被医生选去用某种药的患者，这种药相对于可替代方案的效果如何？

这恰好对应 ATT 的临床含义。

以 GLP-1 与 SGLT-2 为例：

ATE：适用于所有符合条件的患者
ATT：适用于现实中被开 GLP-1 的患者
ATC：适用于现实中被开 SGLT-2 的患者

如果医生的处方行为本身就体现了患者异质性，那么 ATT 往往更贴近真实临床决策场景。

六、读论文时，如何快速判断自己看到的是哪一种 estimand？

可以抓住以下关键词。

ATE

average treatment effect
effect in the overall eligible population

ATT

average treatment effect among the treated
among initiators of drug A
control group weighted to resemble the treated

ATC

average treatment effect among controls
treatment group weighted to resemble controls

如果论文同时出现 SMR weights 和 “among those treated”，几乎可以直接想到：作者的目标大概率是 ATT。

七、Takeaways

因果推断里最容易被忽视的一点是：先明确你在平均谁，再谈如何计算。

ATE：平均到全体
ATT：平均到 treated
ATC：平均到 controls

而 SMR weights 的典型角色，是把比较组标准化到 treatment 组的协变量分布，从而支持 ATT 的估计。

理解了这一层，读药物流行病学论文时就不容易被一堆术语绕进去。

--- title: "因果 estimand" date: 2026-04-03 description: >- Understanding different causal estimands (ATE, ATT, ATC) and their implications. image: "https://cdn.jsdelivr.net/gh/Leslie-Lu/images/images/43faf651802366b70bfef5bbc1f7eeee.jpg" categories: - causal inference - epidemiology - estimands - propensity score - smr weights - att - ate format: html: shift-heading-level-by: 1 include-in-header: - text: | <style type="text/css"> hr.dinkus { width: 50px; margin: 2em auto 2em; border-top: 5px dotted #454545; } div.column-margin+hr.dinkus { margin: 1em auto 2em; } </style> --- ## 一、为什么很多人学了 propensity score，仍然分不清自己在估计什么？因为在因果推断里，**方法**和 **estimand** 不是一回事。同样是做倾向评分加权，你可能估计的是： - ATE - ATT - ATC 这三者不是同一个量的不同算法，而是三个本来就不同的因果问题。 ## 二、ATE、ATT、ATC 分别是什么意思？设： - `T=1`：接受治疗，比如起始 GLP-1 receptor agonists - `T=0`：接受对照，比如起始 SGLT-2 inhibitors - `Y(1)`：若接受治疗时的潜在结局 - `Y(0)`：若接受对照时的潜在结局 ### 1. ATE：average treatment effect $$ ATE = E[Y(1)-Y(0)] $$ 它回答的是： > 在整个目标人群中，如果所有人都接受治疗，与如果所有人都接受对照相比，平均会差多少？平均对象是**整个研究总体**。 ### 2. ATT：average treatment effect among the treated $$ ATT = E[Y(1)-Y(0)\mid T=1] $$ 它回答的是： > 在那些实际上接受了治疗的人中，治疗相对于如果这些同样的人改为接受对照，平均会差多少？平均对象是**treated 人群**。 ### 3. ATC：average treatment effect among the controls $$ ATC = E[Y(1)-Y(0)\mid T=0] $$ 它回答的是： > 在那些实际上接受了对照的人中，如果他们改为接受治疗，平均会差多少？平均对象是**control 人群**。 ## 三、为什么同一项研究里 ATE、ATT、ATC 可能不一样？因为 treatment effect 往往不是对所有人都相同。举例来说，如果 GLP-1 对高 BMI 患者效果更强，而现实中高 BMI 患者又更容易被开 GLP-1，那么： - `ATT` 可能比 `ATE` 更大 - `ATC` 可能又和前两者不同 ## 四、SMR weights 是什么？为什么它常对应 ATT？ `SMR` 指的是 `standardized mortality ratio` 权重。尽管名字里有 mortality，但在方法学上它并不限于死亡结局，也常用于其他终点的标准化分析。当目标 estimand 是 `ATT` 时，一个常见的 SMR weighting 形式是： - 对 treatment 组：`w=1` - 对 control 组：`w=e(X)/(1-e(X))` 其中 `e(X)` 是 propensity score。这组权重的含义是： > 不改变 treatment 组本身，而把 control 组重加权成"看起来像 treatment > 组"的协变量分布。因此，最终估计的就是 treated population 下的反事实对照结果，也就是 `ATT`。 ## 五、ATT 为什么在药物流行病学里很常见？因为很多药物流行病学研究的问题本来就是： > 对于那些现实中已经被医生选去用某种药的患者，这种药相对于可替代方案的效果如何？这恰好对应 `ATT` 的临床含义。以 GLP-1 与 SGLT-2 为例： - `ATE`：适用于所有符合条件的患者 - `ATT`：适用于现实中被开 GLP-1 的患者 - `ATC`：适用于现实中被开 SGLT-2 的患者如果医生的处方行为本身就体现了患者异质性，那么 `ATT` 往往更贴近真实临床决策场景。 ## 六、读论文时，如何快速判断自己看到的是哪一种 estimand？可以抓住以下关键词。 ### ATE - average treatment effect - effect in the overall eligible population ### ATT - average treatment effect among the treated - among initiators of drug A - control group weighted to resemble the treated ### ATC - average treatment effect among controls - treatment group weighted to resemble controls 如果论文同时出现 `SMR weights` 和 "among those treated"，几乎可以直接想到：作者的目标大概率是 `ATT`。 ## 七、Takeaways 因果推断里最容易被忽视的一点是：**先明确你在平均谁，再谈如何计算。** - `ATE`：平均到全体 - `ATT`：平均到 treated - `ATC`：平均到 controls 而 `SMR weights` 的典型角色，是把比较组标准化到 treatment 组的协变量分布，从而支持 `ATT` 的估计。理解了这一层，读药物流行病学论文时就不容易被一堆术语绕进去。