一文搞懂如何选择卡方检验

chi-square test
biostatisitcs
chi-square test
Author
Published

Thursday, April 30, 2020

在实际进行数据处理过程中,我发现有的时候,会有小伙伴在选择何种检验方法时,存在一定的疑问。今天咱们梳理一下究竟如何选择卡方检验及其相关检验方法。

四格表资料卡方检验

  • 非配对设计时

    1. 当总样本量n>=40且所有理论数T>=5时,用普通的Pearson卡方检验,若所得的P约等于检验水准,改用确切概率法;

    2. 当总样本量n>=40但有1<=T<5时,用连续性校正的卡方检验;

    3. 当总样本量n<40或有理论数T<1时,不能用卡方检验,改用确切概率法。

  • 配对设计时

    1. 四格表配对卡方检验对称性检验:McNemar检验;

    2. 配对卡方检验的一致性检验:Kappa一致性检验。

R*C 表资料卡方检验

R*C 表资料可以分为双向无序、单向有序、双向有序属性相同和双向有序属性不同4类:

  1. 双向无序R*C表:表中两个分类变量皆为无序分类变量,对于该类资料:

    1. 若研究目的为多个样本率或构成比的比较,可用行*列表资料的卡方检验;

    2. 若研究目的为分析两个分类变量之间有无关联性以及关系的密切程度,可用行*列表资料的卡方检验,以及Pearson列联系数进行分析

  2. 单向有序R*C表有两种形式:一种是R*C表中的分组变量有序、指标变量无序,此种单向有序R*C表可用行*列表资料的卡方检验;另一种是R*C表中的分组变量无序、指标变量有序,此种单向有序R*C表宜用秩和检验或行均分检验进行分析。

    具体采用哪种检验方法,需要重点关注谁为指标变量、谁为分组变量以及指标变量是否有序。

  3. 双向有序属性相同的R*C表,表中的两个分类变量皆为有序且属性相同,研究目的通常是分析两种方法的一致性,实际上是2*2配对设计的扩展,此时宜用Kappa一致性检验,也可以用特殊模型分析方法。一致性检验与处理配对设计2*2表的思路一样。

    除了对该方表资料作一致性检验外,还可以对两种方法的结果不一致的部分作比较,此时称为对称性检验。

  4. 双向有序属性不同的R*C表,表中的两个分类变量皆为有序且属性不同。对于此类资料,有3种分析目的,所以也就有3种相应的统计分析方法:

    1. 只关心试验分组变量取不同水平时,有序的指标结果变量之间的差别是否有显著性差异,可用单向有序列联表的第二种行均分检验;

    2. 希望研究两个有序变量之间是否有相关关系,需要运用定性资料的相关分析方法,包括Spearman秩相关分析和典型相关分析;

    3. 若两个有序变量之间有相关关系,但不能推断两个变量之间是否是线性相关,是否呈直线变化关系,还需要进一步研究两个变量之间是否呈直线变化关系,即两个有序分类变量间是否存在线性变化趋势,还需要进一步进行线性趋势检验即趋势卡方检验,以判断两变量是否线性相关。