证明平衡设计与非平衡设计的统计学效率

引言

比较两独立样本在主要疗效指标为定量指标的前提下，平衡设计和非平衡设计的统计学效率。

方差相等背景

证明：在两独立样本的主要疗效指标方差相等的前提下，平衡设计的统计学效率高于非平衡设计。

假设有两个独立样本：

样本1：均值为 $\mu_1$，方差为 $\sigma^2$，样本量为 $n_1$；
样本2：均值为 $\mu_2$，方差为 $\sigma^2$（假设两样本结局变量的方差相等），样本量为 $n_2$。

总样本量固定为 $N = n_1 + n_2$。

设计类型如下：

平衡设计：$n_1 = n_2 = \frac{N}{2}$。
非平衡设计：$n_1 \neq n_2$，但 $n_1 + n_2 = N$。

假设 $N$ 足够大，可以采用基于标准正态分布的 $Z$ 检验代替 $t$ 检验。

估计量的方差（精度）

对于两个独立样本，均值差的估计量为 $\bar{x}_1 - \bar{x}_2$。由于样本独立且方差相等，其方差为：

\[ \text{Var}(\bar{x}_1 - \bar{x}_2) = \text{Var}(\bar{x}_1) + \text{Var}(\bar{x}_2) = \frac{\sigma^2}{n_1} + \frac{\sigma^2}{n_2} = \sigma^2 \left( \frac{1}{n_1} + \frac{1}{n_2} \right) \]

我们需要证明，在 $n_1 + n_2 = N$ 固定的情况下，$\frac{1}{n_1} + \frac{1}{n_2}$ 在 $n_1 = n_2 = \frac{N}{2}$ 时取得最小值。

令 $n_2 = N - n_1$，则：

\[ \frac{1}{n_1} + \frac{1}{n_2} = \frac{1}{n_1} + \frac{1}{N - n_1} = \frac{N}{n_1 (N - n_1)} \]

定义函数：

\[ f(n_1) = \frac{N}{n_1 (N - n_1)} \]

其中 $N$ 为常数，$n_1$ 的取值范围为 $0 < n_1 < N$。目标是找到使 $f(n_1)$ 最小的 $n_1$。

为了简化，考虑最大化分母 $g(n_1) = n_1 (N - n_1)$，因为 $f(n_1) = \frac{N}{g(n_1)}$，当 $g(n_1)$ 最大时，$f(n_1)$ 最小。

计算 $g(n_1)$ 的导数：

\[ g(n_1) = n_1 N - n_1^2 \]

\[ g'(n_1) = N - 2n_1 \]

令 $g'(n_1) = 0$：

\[ N - 2n_1 = 0 \implies n_1 = \frac{N}{2} \]

计算二阶导数以验证极值：

\[ g''(n_1) = -2 < 0 \]

由于二阶导数为负，$n_1 = \frac{N}{2}$ 时 $g(n_1)$ 取得最大值，因此 $f(n_1)$ 取得最小值。

代入 $n_1 = n_2 = \frac{N}{2}$：

\[ \frac{1}{n_1} + \frac{1}{n_2} = \frac{1}{\frac{N}{2}} + \frac{1}{\frac{N}{2}} = \frac{2}{\frac{N}{2}} = \frac{4}{N} \]

在 $n_1 = n_2$ 时方差最小，表明平衡设计下估计量的精度最高。

方差不相等背景

证明：在两独立样本的主要疗效指标方差不相等的前提下，非平衡设计的统计学效率高于平衡设计。估 ### 估计量的方差（精度）

延用上面的推导，假设两组的方差分别为 $\sigma_1^2$ 和 $\sigma_2^2$，则两组均值差的估计量 $\bar{x}_1 - \bar{x}_2$ 的方差为：

\[ \text{Var}(\bar{x}_1 - \bar{x}_2) = \frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2} \]

设 $n_2 = N - n_1$，目标函数：

\[ f(n_1) = \frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{N - n_1} \]

求导并令 $f'(n_1) = 0$：

\[ -\frac{\sigma_1^2}{n_1^2} + \frac{\sigma_2^2}{(N - n_1)^2} = 0 \]

\[ n_1 = \frac{N \sigma_1}{\sigma_1 + \sigma_2}, \quad n_2 = \frac{N \sigma_2}{\sigma_1 + \sigma_2} \]

我们可以看到，最优分配比例为 $n_1 : n_2 = \sigma_1 : \sigma_2$ 。这也表明，当方差不相等时，最优设计是非平衡的，而上面方差相等的情况是一种特例。

非平衡设计方差：

\[ \text{Var}_{\text{opt}} = \frac{(\sigma_1 + \sigma_2)^2}{N} \]

平衡设计方差：

\[ \text{Var}_{\text{bal}} = \frac{2 (\sigma_1^2 + \sigma_2^2)}{N} \]

二者差值：

\[ \text{Var}_{\text{bal}} - \text{Var}_{\text{opt}} = \frac{(\sigma_1 - \sigma_2)^2}{N} > 0 \quad (\text{当} \sigma_1 \neq \sigma_2) \]

这也表明非平衡设计方差更小，效率更高。

当在某些情况下为了更多获得新药的信息，可能会在设计时考虑非平衡设计，此种情况下，提高方差较大组受试者的样本量，可以提高试验的统计学效率。

结论

综合以上分析：

在两独立样本的方差相等且总样本量固定的前提下，平衡设计的统计学效率高于非平衡设计。
在两独立样本的方差不相等的前提下，非平衡设计的统计学效率高于平衡设计。

更加一般地，除了上面的 $Z$ 检验和 $t$ 检验，包括 $Wald \quad test$ 和 $score \quad test$ 等，均符合上述结论。

--- title: "证明平衡设计与非平衡设计的统计学效率" date: 2025-03-10 description: "balanced design and unequal allocation" image: "https://cdn.jsdelivr.net/gh/Leslie-Lu/WeChatOfficialAccount/img_2025/20250310153136.png" categories: - RCT - Statistics - Methodology - balanced design - power analysis - allocation format: html: shift-heading-level-by: 1 include-in-header: - text: | <style type="text/css"> hr.dinkus { width: 50px; margin: 2em auto 2em; border-top: 5px dotted #454545; } div.column-margin+hr.dinkus { margin: 1em auto 2em; } </style> --- ## 引言比较两独立样本在主要疗效指标为定量指标的前提下，平衡设计和非平衡设计的统计学效率。 ## 方差相等背景证明：在两独立样本的主要疗效指标方差相等的前提下，平衡设计的统计学效率高于非平衡设计。假设有两个独立样本： - **样本1**：均值为 $\mu_1$，方差为 $\sigma^2$，样本量为 $n_1$； - **样本2**：均值为 $\mu_2$，方差为 $\sigma^2$（假设两样本结局变量的方差相等），样本量为 $n_2$。总样本量固定为 $N = n_1 + n_2$。设计类型如下： - **平衡设计**：$n_1 = n_2 = \frac{N}{2}$。 - **非平衡设计**：$n_1 \neq n_2$，但 $n_1 + n_2 = N$。假设 $N$ 足够大，可以采用基于标准正态分布的 $Z$ 检验代替 $t$ 检验。 ### 估计量的方差（精度）对于两个独立样本，均值差的估计量为 $\bar{x}_1 - \bar{x}_2$。由于样本独立且方差相等，其方差为： $$ \text{Var}(\bar{x}_1 - \bar{x}_2) = \text{Var}(\bar{x}_1) + \text{Var}(\bar{x}_2) = \frac{\sigma^2}{n_1} + \frac{\sigma^2}{n_2} = \sigma^2 \left( \frac{1}{n_1} + \frac{1}{n_2} \right) $$ 我们需要证明，在 $n_1 + n_2 = N$ 固定的情况下，$\frac{1}{n_1} + \frac{1}{n_2}$ 在 $n_1 = n_2 = \frac{N}{2}$ 时取得最小值。令 $n_2 = N - n_1$，则： $$ \frac{1}{n_1} + \frac{1}{n_2} = \frac{1}{n_1} + \frac{1}{N - n_1} = \frac{N}{n_1 (N - n_1)} $$ 定义函数： $$ f(n_1) = \frac{N}{n_1 (N - n_1)} $$ 其中 $N$ 为常数，$n_1$ 的取值范围为 $0 < n_1 < N$。目标是找到使 $f(n_1)$ 最小的 $n_1$。为了简化，考虑最大化分母 $g(n_1) = n_1 (N - n_1)$，因为 $f(n_1) = \frac{N}{g(n_1)}$，当 $g(n_1)$ 最大时，$f(n_1)$ 最小。计算 $g(n_1)$ 的导数： $$ g(n_1) = n_1 N - n_1^2 $$ $$ g'(n_1) = N - 2n_1 $$ 令 $g'(n_1) = 0$： $$ N - 2n_1 = 0 \implies n_1 = \frac{N}{2} $$ 计算二阶导数以验证极值： $$ g''(n_1) = -2 < 0 $$ 由于二阶导数为负，$n_1 = \frac{N}{2}$ 时 $g(n_1)$ 取得最大值，因此 $f(n_1)$ 取得最小值。代入 $n_1 = n_2 = \frac{N}{2}$： $$ \frac{1}{n_1} + \frac{1}{n_2} = \frac{1}{\frac{N}{2}} + \frac{1}{\frac{N}{2}} = \frac{2}{\frac{N}{2}} = \frac{4}{N} $$ 在 $n_1 = n_2$ 时方差最小，表明平衡设计下估计量的精度最高。 ## 方差不相等背景证明：在两独立样本的主要疗效指标方差不相等的前提下，非平衡设计的统计学效率高于平衡设计。估 ### 估计量的方差（精度）延用上面的推导，假设两组的方差分别为 $\sigma_1^2$ 和 $\sigma_2^2$，则两组均值差的估计量 $\bar{x}_1 - \bar{x}_2$ 的方差为： $$ \text{Var}(\bar{x}_1 - \bar{x}_2) = \frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{n_2} $$ 设 $n_2 = N - n_1$，目标函数： $$ f(n_1) = \frac{\sigma_1^2}{n_1} + \frac{\sigma_2^2}{N - n_1} $$ 求导并令 $f'(n_1) = 0$： $$ -\frac{\sigma_1^2}{n_1^2} + \frac{\sigma_2^2}{(N - n_1)^2} = 0 $$ $$ n_1 = \frac{N \sigma_1}{\sigma_1 + \sigma_2}, \quad n_2 = \frac{N \sigma_2}{\sigma_1 + \sigma_2} $$ 我们可以看到，最优分配比例为 $n_1 : n_2 = \sigma_1 : \sigma_2$ 。这也表明，当方差不相等时，最优设计是非平衡的，而上面方差相等的情况是一种特例。 - **非平衡设计方差**： $$ \text{Var}_{\text{opt}} = \frac{(\sigma_1 + \sigma_2)^2}{N} $$ - **平衡设计方差**： $$ \text{Var}_{\text{bal}} = \frac{2 (\sigma_1^2 + \sigma_2^2)}{N} $$ 二者差值： $$ \text{Var}_{\text{bal}} - \text{Var}_{\text{opt}} = \frac{(\sigma_1 - \sigma_2)^2}{N} > 0 \quad (\text{当} \sigma_1 \neq \sigma_2) $$ 这也表明非平衡设计方差更小，效率更高。当在某些情况下为了更多获得新药的信息，可能会在设计时考虑非平衡设计，此种情况下，提高方差较大组受试者的样本量，可以提高试验的统计学效率。 ## 结论综合以上分析： - 在两独立样本的方差相等且总样本量固定的前提下，**平衡设计的统计学效率高于非平衡设计**。 - 在两独立样本的方差不相等的前提下，**非平衡设计的统计学效率高于平衡设计**。更加一般地，除了上面的 $Z$ 检验和 $t$ 检验，包括 $Wald \quad test$ 和 $score \quad test$ 等，均符合上述结论。