一、为什么会有 inverse probability weighting?
在观察性研究里,研究者经常面对一个根本问题:不同人进入某种“数据路径”的概率并不一样。
例如:
- 有些人更容易接受某种治疗
- 有些人更容易失访
- 有些人更容易在随访中停药或偏离方案
- 有些人更容易被完整观察到
如果直接拿观察到的数据做比较,得到的往往不是目标总体中的真实平均效应,而是一个已经被选择机制扭曲过的结果。
inverse probability weighting(IPW,逆概率加权)的核心思想非常直接:
谁更不容易被观察到、被分配到当前状态,谁就应该在分析中有更大的权重。
数学上,它通常长成下面这样:
\[ w_i = \frac{1}{P(\text{进入当前观察状态} \mid \text{已知协变量和历史})} \]
概率越小,权重越大。直观上,一个“很难出现在你数据里但实际出现了”的个体,需要代表更多与他相似但没有被观察到的人。
二、IPW 是总类,IPTW 和 IPCW 是具体应用
很多人第一次接触时会把 IPW、IPTW、IPCW 当成三个完全不同的方法。其实更准确的理解是:
IPW是总类IPTW是把 IPW 用在 treatment assignment 上IPCW是把 IPW 用在 censoring / observation process 上
也就是说,它们的统计思想完全一致,区别只在于“逆的到底是哪一个概率”。
1. IPTW:inverse probability of treatment weighting
IPTW 用来纠正治疗分配不是随机的这个问题。
设:
T=1表示接受治疗T=0表示未接受治疗或接受对照治疗X表示协变量e(X)=P(T=1\mid X)表示 propensity score
最常见的 ATE 权重是:
\[ w_i=\frac{T_i}{e(X_i)}+\frac{1-T_i}{1-e(X_i)} \]
直观上:
- 一个本来不太可能接受治疗但实际接受治疗的人,在治疗组里更“稀有”,权重更大
- 一个本来不太可能留在对照组但实际留在对照组的人,在对照组里更“稀有”,权重也更大
经过这种加权后,我们希望在加权伪总体中,治疗组与对照组的协变量分布更接近,从而减少混杂。
2. IPCW:inverse probability of censoring weighting
IPCW 用来纠正删失不是随机的这个问题。
设:
R=1表示某时点仍然被观察到、未删失R=0表示已经删失
则一个常见想法是对未删失者赋予权重:
\[ w_i=\frac{1}{P(R_i=1\mid X_i,\text{history})} \]
它的直觉是:
那些本来很容易失访、停药、偏离方案,但实际上还留在样本里的人,需要代表那些和他们相似、却已经被删失的人。
因此:
IPTW解决的是 treatment selection biasIPCW解决的是 informative censoring / selection during follow-up
三、为什么 IPTW 和 IPCW 本质上都是 IPW?
从更抽象的层面看,IPW 在做的是同一件事:
用样本进入当前观察路径的概率倒数,对样本重新加权,从而重建一个更接近目标试验或目标总体的伪总体。
因此你完全可以把它们理解为:
IPTW:对“接受当前治疗状态”的概率做逆概率加权IPCW:对“持续未删失/未偏离方案”的概率做逆概率加权
在纵向因果推断里,两者还经常一起出现。比如在 marginal structural model(MSM)里,研究者可能同时需要:
- 用
IPTW调整 time-varying treatment assignment - 用
IPCW调整 informative censoring
最终的权重就是两部分相乘:
\[ w_i = w_i^{treatment}\times w_i^{censoring} \]
四、一个最容易混淆的问题:为什么 IPCW 不是对“被删失概率”加权?
初学者经常会问:既然叫 inverse probability of censoring weighting,为什么很多公式里放的是“未被删失”的概率?
原因在于分析时真正还留在风险集里的,是那些尚未删失的人。我们要做的是让这些人代表那些本来相似、但已经被删失的人。因此权重通常赋给“还在样本里的人”。
所以在实践中常见的是:
\[ w_i(t)=\frac{1}{P(C_i(t)=0\mid \text{过去历史})} \]
这里 C_i(t)=0 表示截至时点 t 尚未删失。
换句话说:
- 不是给“已经删失的人”补权重
- 而是给“尚未删失的人”加更大的权重,让他们代替已删失者说话
五、IPW 的关键假设是什么?
无论是 IPTW 还是 IPCW,都不是魔法。它们要成立,至少依赖三类核心假设。
1. 没有重要的未测量混杂或未测量选择因素
如果决定治疗、决定删失的关键因素没有被测量或没有进入模型,那么加权模型即使形式上写得很漂亮,也仍然会有偏。
2. 正值性(positivity)
也就是:
- 每种协变量模式下,都有机会接受任一治疗
- 每种协变量模式下,都有机会继续被观察到
如果某些人几乎一定会接受某药,或几乎一定会失访,那么相应的分母概率会非常接近 0,权重就会爆炸。
3. 模型不能错得太离谱
无论你用的是 logistic regression、machine learning 还是 pooled models,本质上都在估计某个条件概率。如果这个模型严重错设,权重就会不稳定,甚至系统性偏误。
六、为什么大家总担心极端权重?
因为 IPW 最大的实践风险就是高方差。
例如,如果某个人在当前历史下“继续未删失”的概率只有 0.01,但他确实还留在样本里,那么他的 IPCW 就会接近 100。这种情况下,少数样本就可能决定整体结果。
因此实务中常会做几件事:
- 检查 propensity score 或 censoring probability 的分布
- 看权重是否过大、是否长尾
- 使用 stabilized weights
- 必要时做 truncation / trimming
- 做平衡性诊断,而不是只盯着模型 AUC
七、如何用一句话区分 IPW、IPTW、IPCW?
可以记成下面三句话:
IPW:总的思想,谁更难被观察到或被分配到当前状态,谁权重更大IPTW:纠正治疗分配不随机IPCW:纠正删失或偏离方案不随机
再浓缩一点:
IPTW 和 IPCW 不是两套彼此无关的方法,而是 IPW 在不同选择机制上的两个典型实现。
八、实际写作和解读论文时,应该重点看什么?
如果一篇文章声称“使用了 inverse probability weighting”,真正值得你追问的不是“用了没有”,而是:
- 它逆的是治疗概率,还是删失概率,还是两者都有?
- 目标 estimand 是 ATE、ATT、还是 per-protocol effect?
- 权重模型里纳入了哪些变量?
- 时间变化协变量是如何处理的?
- 权重是否稳定,是否有截尾?
- 加权后协变量平衡是否真的改善?
只有这些问题都说得清楚,IPW 才不是一句方法学口号,而是真正服务于因果问题的设计与分析工具。
九、Takeaways
IPW 的本质不是“复杂建模”,而是“重建样本代表性”。
在这个统一框架下:
IPTW解决的是“谁更可能接受治疗”IPCW解决的是“谁更可能持续留在观察中”
二者共享同一个核心思想:用逆概率加权构造一个更接近目标试验的伪总体。
理解了这一点,再去看 MSM、target trial emulation、per-protocol analysis,就会顺畅很多。