因果推断-2

关于因果推断的基本概念
biostatistics
causal inference
Author
Published

Thursday, January 2, 2020

统计值的不确定性意味着什么?

统计推断利用统计方法生成一个问题答案的实际估计值,并给出对该估计值的不确定性大小的统计估计。这种不确定性反映了样本数据集的代表性以及可能存在的测量误差或数据缺失。数据永远是从理论上无限的总体中抽取的有限样本。我们无法避免根据样本测量的概率无法代表整个总体的相应概率的可能性。统计学提供了很多方法来应对这种不确定性,包括极大似然估计、倾向评分、置信区间、显著性检验等。

相关与独立

以因果模型的路径图(因果图)来表示的变量之间的听从模式通常会导向数据中某种显而易见的模式或者相关关系。“A和B之间没有连接路径”翻译成统计语言,就是“A和B相互独立”,即发现A的存在不会改变B发生的可能性。

想象力与规划

历史学家尤瓦尔·赫拉利在他的《人类简史》一书中指出,人类祖先想象不存在之物的能力是一切的关键,正是这种能力让他们得以交流得更加顺畅。在获得这种能力之前,他们只相信自己的直系亲属或者本部落的人。而此后,信任就因共同的幻想(例如信仰无形但可想象的神,信仰来世,或者信仰领袖的神性)和期许而延伸到了更大的群体。我们的智人祖先新掌握的因果想象力使他们能够通过一种被我们称为“规划”的复杂过程更有效地完成许多事情,例如他们可以通过想象和比较几个狩猎策略的结果来完成一次狩猎活动。而要做到这一点,思维主体必须具备一个可供参考并且可以自主调整的关于狩猎现实的心理模型。心理模型是施展想象力的舞台,它使我们可以通过对模型局部的自主调整修改来试验重估不同情景的概率,人类的心理模型因而具有一种模块性,其涉及预测对环境进行刻意改变后的结果,并根据预测结果选择行为方案以催生出自己所期待的结果。