第六章 大量的悖论⭐(实例)
CHAPTER 6 — Paradoxes Galore!
- 出生体重悖论反映了因果关系和相关关系之间的张力,这种张力源自于二者处于因果关系之梯的两个不同层级上,又因为人类的直觉在因果逻辑下运作而数据遵从的则是概率和比例的逻辑而进一步加剧。(165)
- 当我们在一个领域所学到的规则误用到其他的领域时,悖论就出现了。(165)
- 因果悖论突出强调了直觉性的因果推理模式与概率统计逻辑相冲突的地方。(165)
令人费解的“蒙提·霍尔悖论”
问题:三个门,两羊一车,选一个,主持人打开另外两个中有羊的一个,此时,换门是否更有利于赢得车?(166)
解决这一悖论的关键是,不仅需要考虑数据,也需要注意数据生成的过程。(167)
习惯“数据约简”而忽略数据的生成过程是不可取的。(168)
-
上图为该悖论的因果图,“主持人打开的门”是一个对撞因子,一旦我们获得了关于这个变量的信息,图中所有的概率都变成了关于这一信息的条件概率。但是,当我们以对撞因子为条件时,就会在两个父节点之间制造出一种虚假的依存关系(伪相关)。(169)
贝叶斯分析的一个普遍主题:任何通过了威胁其有效性的测试的假设,其可能性都会变大。威胁越大,幸存下来的假设的可能性就越大。(170)
更多的对撞偏倚:伯克森悖论
问题:两种疾病即使在一般人群中彼此不存在实际联系,在医院的病人中也会形成某种似是而非的关联。(172)
同类型的悖论现象:扔硬币游戏,同时扔两个硬币100次,只在至少一次正面的情况下记录结果,根据这些记录,会发现两枚硬币的抛掷结果并不独立,每次当硬币1为反面落地时,硬币2必为正面落地。
事实上,这些结果是删除了所有两枚硬币都是背面朝上的结果后得到的,换句话说:对这个对撞因子进行了变量控制。(174)⭐
最纯粹的、最本质的意义上:我们观察到的相关就是一种错觉,我们选择哪些事件进入数据集同时忽略另一些事的做法给我们自己带来了错觉。(175)
辛普森悖论
- 问题:BBG药物,服用药物对男性患者群体有害,对女性患者群体也有害,但对整体的患者群体有益。(176)
- 确凿性原则:假设无论事件C是否发生,某个行动都会增加某一结果的可能性,则该行动也将在我们不知道C是否发生的情况下增加这个结果的可能性,条件是该行动不改变C的概率。(181)
- 使用聚合数据或者分割数据,哪种做法更合适,取决于数据的生成过程。(182)
- 只有当每个子总体的相对比例在各群组之间一致的情况下,确凿性原则才起作用。(189)
《THE BOOK OF WHY: THE NEW SCIENCE OF CAUSE AND EFFECT》
——JUDEA PEARL AND DANA MACKENZIE
本文链接: https://hexo.whtli.cn/archives/be2adc3a.html
版权声明: 遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声明。