证明平衡设计与非平衡设计的统计学效率

balanced design and unequal allocation
RCT
Statistics
Methodology
balanced design
power analysis
allocation
Author
Published

Monday, March 10, 2025

引言

比较两独立样本在主要疗效指标为定量指标的前提下,平衡设计和非平衡设计的统计学效率。

方差相等背景

证明:在两独立样本的主要疗效指标方差相等的前提下,平衡设计的统计学效率高于非平衡设计。

假设有两个独立样本:

  • 样本1:均值为 \(\mu_1\),方差为 \(\sigma^2\),样本量为 \(n_1\)

  • 样本2:均值为 \(\mu_2\),方差为 \(\sigma^2\)(假设两样本结局变量的方差相等),样本量为 \(n_2\)

总样本量固定为 \(N = n_1 + n_2\)

设计类型如下:

  • 平衡设计\(n_1 = n_2 = \frac{N}{2}\)

  • 非平衡设计\(n_1 \neq n_2\),但 \(n_1 + n_2 = N\)

假设 \(N\) 足够大,可以采用基于标准正态分布的 \(Z\) 检验代替 \(t\) 检验。

估计量的方差(精度)

对于两个独立样本,均值差的估计量为 \(\bar{x}_1 - \bar{x}_2\)。由于样本独立且方差相等,其方差为:

\[ \text{Var}(\bar{x}_1 - \bar{x}_2) = \text{Var}(\bar{x}_1) + \text{Var}(\bar{x}_2) = \frac{\sigma^2}{n_1} + \frac{\sigma^2}{n_2} = \sigma^2 \left( \frac{1}{n_1} + \frac{1}{n_2} \right) \]

我们需要证明,在 \(n_1 + n_2 = N\) 固定的情况下,\(\frac{1}{n_1} + \frac{1}{n_2}\)\(n_1 = n_2 = \frac{N}{2}\) 时取得最小值。

\(n_2 = N - n_1\),则:

\[ \frac{1}{n_1} + \frac{1}{n_2} = \frac{1}{n_1} + \frac{1}{N - n_1} = \frac{N}{n_1 (N - n_1)} \]

定义函数:

\[ f(n_1) = \frac{N}{n_1 (N - n_1)} \]

其中 \(N\) 为常数,\(n_1\) 的取值范围为 \(0 < n_1 < N\)。目标是找到使 \(f(n_1)\) 最小的 \(n_1\)

为了简化,考虑最大化分母 \(g(n_1) = n_1 (N - n_1)\),因为 \(f(n_1) = \frac{N}{g(n_1)}\),当 \(g(n_1)\) 最大时,\(f(n_1)\) 最小。

计算 \(g(n_1)\) 的导数:

\[ g(n_1) = n_1 N - n_1^2 \]

\[ g'(n_1) = N - 2n_1 \]

\(g'(n_1) = 0\)

\[ N - 2n_1 = 0 \implies n_1 = \frac{N}{2} \]

计算二阶导数以验证极值:

\[ g''(n_1) = -2 < 0 \]

由于二阶导数为负,\(n_1 = \frac{N}{2}\)\(g(n_1)\) 取得最大值,因此 \(f(n_1)\) 取得最小值。

代入 \(n_1 = n_2 = \frac{N}{2}\)

\[ \frac{1}{n_1} + \frac{1}{n_2} = \frac{1}{\frac{N}{2}} + \frac{1}{\frac{N}{2}} = \frac{2}{\frac{N}{2}} = \frac{4}{N} \]

\(n_1 = n_2\) 时方差最小,表明平衡设计下估计量的精度最高。

方差不相等背景

证明:在两独立样本的主要疗效指标方差不相等的前提下,非平衡设计的统计学效率高于平衡设计。 估 ### 估计量的方差(精度)

延用上面的推导,假设两组的方差分别为 \(\sigma_1^2\)\(\sigma_2^2\),则两组均值差的 估计量 \(\bar{x}_1 - \bar{x}_2\) 的方差为:

\[ \text{Var}(\bar{x}_1 - \bar{x}_2) = \frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2} \]

\(n_2 = N - n_1\),目标函数:

\[ f(n_1) = \frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{N - n_1} \]

求导并令 \(f'(n_1) = 0\)

\[ -\frac{\sigma_1^2}{n_1^2} + \frac{\sigma_2^2}{(N - n_1)^2} = 0 \]

\[ n_1 = \frac{N \sigma_1}{\sigma_1 + \sigma_2}, \quad n_2 = \frac{N \sigma_2}{\sigma_1 + \sigma_2} \]

我们可以看到,最优分配比例为 \(n_1 : n_2 = \sigma_1 : \sigma_2\) 。这也表明,当方差不相等时,最优设计是非平衡的,而上面方差相等的情况是一种特例。

  • 非平衡设计方差

\[ \text{Var}_{\text{opt}} = \frac{(\sigma_1 + \sigma_2)^2}{N} \]

  • 平衡设计方差

\[ \text{Var}_{\text{bal}} = \frac{2 (\sigma_1^2 + \sigma_2^2)}{N} \]

二者差值:

\[ \text{Var}_{\text{bal}} - \text{Var}_{\text{opt}} = \frac{(\sigma_1 - \sigma_2)^2}{N} > 0 \quad (\text{当} \sigma_1 \neq \sigma_2) \]

这也表明非平衡设计方差更小,效率更高。

当在某些情况下为了更多获得新药的信息,可能会在设计时考虑非平衡设计,此种情况下,提高方差较大组受试者的样本量,可以提高试验的统计学效率。

结论

综合以上分析:

  • 在两独立样本的方差相等且总样本量固定的前提下,平衡设计的统计学效率高于非平衡设计

  • 在两独立样本的方差不相等的前提下,非平衡设计的统计学效率高于平衡设计

更加一般地,除了上面的 \(Z\) 检验和 \(t\) 检验,包括 \(Wald \quad test\)\(score \quad test\) 等,均符合上述结论。