引言
比较两独立样本在主要疗效指标为定量指标的前提下,平衡设计和非平衡设计的统计学效率。
方差相等背景
证明:在两独立样本的主要疗效指标方差相等的前提下,平衡设计的统计学效率高于非平衡设计。
假设有两个独立样本:
样本1:均值为 \(\mu_1\),方差为 \(\sigma^2\),样本量为 \(n_1\);
样本2:均值为 \(\mu_2\),方差为 \(\sigma^2\)(假设两样本结局变量的方差相等),样本量为 \(n_2\)。
总样本量固定为 \(N = n_1 + n_2\)。
设计类型如下:
平衡设计:\(n_1 = n_2 = \frac{N}{2}\)。
非平衡设计:\(n_1 \neq n_2\),但 \(n_1 + n_2 = N\)。
假设 \(N\) 足够大,可以采用基于标准正态分布的 \(Z\) 检验代替 \(t\) 检验。
估计量的方差(精度)
对于两个独立样本,均值差的估计量为 \(\bar{x}_1 - \bar{x}_2\)。由于样本独立且方差相等,其方差为:
\[ \text{Var}(\bar{x}_1 - \bar{x}_2) = \text{Var}(\bar{x}_1) + \text{Var}(\bar{x}_2) = \frac{\sigma^2}{n_1} + \frac{\sigma^2}{n_2} = \sigma^2 \left( \frac{1}{n_1} + \frac{1}{n_2} \right) \]
我们需要证明,在 \(n_1 + n_2 = N\) 固定的情况下,\(\frac{1}{n_1} + \frac{1}{n_2}\) 在 \(n_1 = n_2 = \frac{N}{2}\) 时取得最小值。
令 \(n_2 = N - n_1\),则:
\[ \frac{1}{n_1} + \frac{1}{n_2} = \frac{1}{n_1} + \frac{1}{N - n_1} = \frac{N}{n_1 (N - n_1)} \]
定义函数:
\[ f(n_1) = \frac{N}{n_1 (N - n_1)} \]
其中 \(N\) 为常数,\(n_1\) 的取值范围为 \(0 < n_1 < N\)。目标是找到使 \(f(n_1)\) 最小的 \(n_1\)。
为了简化,考虑最大化分母 \(g(n_1) = n_1 (N - n_1)\),因为 \(f(n_1) = \frac{N}{g(n_1)}\),当 \(g(n_1)\) 最大时,\(f(n_1)\) 最小。
计算 \(g(n_1)\) 的导数:
\[ g(n_1) = n_1 N - n_1^2 \]
\[ g'(n_1) = N - 2n_1 \]
令 \(g'(n_1) = 0\):
\[ N - 2n_1 = 0 \implies n_1 = \frac{N}{2} \]
计算二阶导数以验证极值:
\[ g''(n_1) = -2 < 0 \]
由于二阶导数为负,\(n_1 = \frac{N}{2}\) 时 \(g(n_1)\) 取得最大值,因此 \(f(n_1)\) 取得最小值。
代入 \(n_1 = n_2 = \frac{N}{2}\):
\[ \frac{1}{n_1} + \frac{1}{n_2} = \frac{1}{\frac{N}{2}} + \frac{1}{\frac{N}{2}} = \frac{2}{\frac{N}{2}} = \frac{4}{N} \]
在 \(n_1 = n_2\) 时方差最小,表明平衡设计下估计量的精度最高。
方差不相等背景
证明:在两独立样本的主要疗效指标方差不相等的前提下,非平衡设计的统计学效率高于平衡设计。 估 ### 估计量的方差(精度)
延用上面的推导,假设两组的方差分别为 \(\sigma_1^2\) 和 \(\sigma_2^2\),则两组均值差的 估计量 \(\bar{x}_1 - \bar{x}_2\) 的方差为:
\[ \text{Var}(\bar{x}_1 - \bar{x}_2) = \frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2} \]
设 \(n_2 = N - n_1\),目标函数:
\[ f(n_1) = \frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{N - n_1} \]
求导并令 \(f'(n_1) = 0\):
\[ -\frac{\sigma_1^2}{n_1^2} + \frac{\sigma_2^2}{(N - n_1)^2} = 0 \]
\[ n_1 = \frac{N \sigma_1}{\sigma_1 + \sigma_2}, \quad n_2 = \frac{N \sigma_2}{\sigma_1 + \sigma_2} \]
我们可以看到,最优分配比例为 \(n_1 : n_2 = \sigma_1 : \sigma_2\) 。这也表明,当方差不相等时,最优设计是非平衡的,而上面方差相等的情况是一种特例。
- 非平衡设计方差:
\[ \text{Var}_{\text{opt}} = \frac{(\sigma_1 + \sigma_2)^2}{N} \]
- 平衡设计方差:
\[ \text{Var}_{\text{bal}} = \frac{2 (\sigma_1^2 + \sigma_2^2)}{N} \]
二者差值:
\[ \text{Var}_{\text{bal}} - \text{Var}_{\text{opt}} = \frac{(\sigma_1 - \sigma_2)^2}{N} > 0 \quad (\text{当} \sigma_1 \neq \sigma_2) \]
这也表明非平衡设计方差更小,效率更高。
当在某些情况下为了更多获得新药的信息,可能会在设计时考虑非平衡设计,此种情况下,提高方差较大组受试者的样本量,可以提高试验的统计学效率。
结论
综合以上分析:
在两独立样本的方差相等且总样本量固定的前提下,平衡设计的统计学效率高于非平衡设计。
在两独立样本的方差不相等的前提下,非平衡设计的统计学效率高于平衡设计。
更加一般地,除了上面的 \(Z\) 检验和 \(t\) 检验,包括 \(Wald \quad test\) 和 \(score \quad test\) 等,均符合上述结论。