IPW、IPTW 与 IPCW:从逆概率加权到治疗加权、删失加权

The difference between inverse probability weighting, inverse probability of treatment weighting, and inverse probability of censoring weighting in causal inference.
causal inference
inverse probability weighting
treatment effects
inverse probability of censoring weighting
inverse probability of treatment weighting
Author
Published

Tuesday, April 7, 2026

一、为什么会有 inverse probability weighting?

在观察性研究里,研究者经常面对一个根本问题:不同人进入某种“数据路径”的概率并不一样。

例如:

  • 有些人更容易接受某种治疗
  • 有些人更容易失访
  • 有些人更容易在随访中停药或偏离方案
  • 有些人更容易被完整观察到

如果直接拿观察到的数据做比较,得到的往往不是目标总体中的真实平均效应,而是一个已经被选择机制扭曲过的结果。

inverse probability weighting(IPW,逆概率加权)的核心思想非常直接:

谁更不容易被观察到、被分配到当前状态,谁就应该在分析中有更大的权重。

数学上,它通常长成下面这样:

\[ w_i = \frac{1}{P(\text{进入当前观察状态} \mid \text{已知协变量和历史})} \]

概率越小,权重越大。直观上,一个“很难出现在你数据里但实际出现了”的个体,需要代表更多与他相似但没有被观察到的人。

二、IPW 是总类,IPTW 和 IPCW 是具体应用

很多人第一次接触时会把 IPWIPTWIPCW 当成三个完全不同的方法。其实更准确的理解是:

  • IPW 是总类
  • IPTW 是把 IPW 用在 treatment assignment 上
  • IPCW 是把 IPW 用在 censoring / observation process 上

也就是说,它们的统计思想完全一致,区别只在于“逆的到底是哪一个概率”。

1. IPTW:inverse probability of treatment weighting

IPTW 用来纠正治疗分配不是随机的这个问题。

设:

  • T=1 表示接受治疗
  • T=0 表示未接受治疗或接受对照治疗
  • X 表示协变量
  • e(X)=P(T=1\mid X) 表示 propensity score

最常见的 ATE 权重是:

\[ w_i=\frac{T_i}{e(X_i)}+\frac{1-T_i}{1-e(X_i)} \]

直观上:

  • 一个本来不太可能接受治疗但实际接受治疗的人,在治疗组里更“稀有”,权重更大
  • 一个本来不太可能留在对照组但实际留在对照组的人,在对照组里更“稀有”,权重也更大

经过这种加权后,我们希望在加权伪总体中,治疗组与对照组的协变量分布更接近,从而减少混杂。

2. IPCW:inverse probability of censoring weighting

IPCW 用来纠正删失不是随机的这个问题。

设:

  • R=1 表示某时点仍然被观察到、未删失
  • R=0 表示已经删失

则一个常见想法是对未删失者赋予权重:

\[ w_i=\frac{1}{P(R_i=1\mid X_i,\text{history})} \]

它的直觉是:

那些本来很容易失访、停药、偏离方案,但实际上还留在样本里的人,需要代表那些和他们相似、却已经被删失的人。

因此:

  • IPTW 解决的是 treatment selection bias
  • IPCW 解决的是 informative censoring / selection during follow-up

三、为什么 IPTW 和 IPCW 本质上都是 IPW?

从更抽象的层面看,IPW 在做的是同一件事:

用样本进入当前观察路径的概率倒数,对样本重新加权,从而重建一个更接近目标试验或目标总体的伪总体。

因此你完全可以把它们理解为:

  • IPTW:对“接受当前治疗状态”的概率做逆概率加权
  • IPCW:对“持续未删失/未偏离方案”的概率做逆概率加权

在纵向因果推断里,两者还经常一起出现。比如在 marginal structural model(MSM)里,研究者可能同时需要:

  • IPTW 调整 time-varying treatment assignment
  • IPCW 调整 informative censoring

最终的权重就是两部分相乘:

\[ w_i = w_i^{treatment}\times w_i^{censoring} \]

四、一个最容易混淆的问题:为什么 IPCW 不是对“被删失概率”加权?

初学者经常会问:既然叫 inverse probability of censoring weighting,为什么很多公式里放的是“未被删失”的概率?

原因在于分析时真正还留在风险集里的,是那些尚未删失的人。我们要做的是让这些人代表那些本来相似、但已经被删失的人。因此权重通常赋给“还在样本里的人”。

所以在实践中常见的是:

\[ w_i(t)=\frac{1}{P(C_i(t)=0\mid \text{过去历史})} \]

这里 C_i(t)=0 表示截至时点 t 尚未删失。

换句话说:

  • 不是给“已经删失的人”补权重
  • 而是给“尚未删失的人”加更大的权重,让他们代替已删失者说话

五、IPW 的关键假设是什么?

无论是 IPTW 还是 IPCW,都不是魔法。它们要成立,至少依赖三类核心假设。

1. 没有重要的未测量混杂或未测量选择因素

如果决定治疗、决定删失的关键因素没有被测量或没有进入模型,那么加权模型即使形式上写得很漂亮,也仍然会有偏。

2. 正值性(positivity)

也就是:

  • 每种协变量模式下,都有机会接受任一治疗
  • 每种协变量模式下,都有机会继续被观察到

如果某些人几乎一定会接受某药,或几乎一定会失访,那么相应的分母概率会非常接近 0,权重就会爆炸。

3. 模型不能错得太离谱

无论你用的是 logistic regression、machine learning 还是 pooled models,本质上都在估计某个条件概率。如果这个模型严重错设,权重就会不稳定,甚至系统性偏误。

六、为什么大家总担心极端权重?

因为 IPW 最大的实践风险就是高方差。

例如,如果某个人在当前历史下“继续未删失”的概率只有 0.01,但他确实还留在样本里,那么他的 IPCW 就会接近 100。这种情况下,少数样本就可能决定整体结果。

因此实务中常会做几件事:

  • 检查 propensity score 或 censoring probability 的分布
  • 看权重是否过大、是否长尾
  • 使用 stabilized weights
  • 必要时做 truncation / trimming
  • 做平衡性诊断,而不是只盯着模型 AUC

七、如何用一句话区分 IPW、IPTW、IPCW?

可以记成下面三句话:

  • IPW:总的思想,谁更难被观察到或被分配到当前状态,谁权重更大
  • IPTW:纠正治疗分配不随机
  • IPCW:纠正删失或偏离方案不随机

再浓缩一点:

IPTW 和 IPCW 不是两套彼此无关的方法,而是 IPW 在不同选择机制上的两个典型实现。

八、实际写作和解读论文时,应该重点看什么?

如果一篇文章声称“使用了 inverse probability weighting”,真正值得你追问的不是“用了没有”,而是:

  • 它逆的是治疗概率,还是删失概率,还是两者都有?
  • 目标 estimand 是 ATE、ATT、还是 per-protocol effect?
  • 权重模型里纳入了哪些变量?
  • 时间变化协变量是如何处理的?
  • 权重是否稳定,是否有截尾?
  • 加权后协变量平衡是否真的改善?

只有这些问题都说得清楚,IPW 才不是一句方法学口号,而是真正服务于因果问题的设计与分析工具。

九、Takeaways

IPW 的本质不是“复杂建模”,而是“重建样本代表性”。

在这个统一框架下:

  • IPTW 解决的是“谁更可能接受治疗”
  • IPCW 解决的是“谁更可能持续留在观察中”

二者共享同一个核心思想:用逆概率加权构造一个更接近目标试验的伪总体。

理解了这一点,再去看 MSM、target trial emulation、per-protocol analysis,就会顺畅很多。