有哪些有趣而著名的悖论?

[复制链接]
查看3436 | 回复0 | 2022-3-19 16:17:14 | 显示全部楼层 |阅读模式
分享一个有趣的悖论:辛普森悖论
; l( _7 t" S/ k8 e  u辛普森悖论为英国统计学家E.H.辛普森E.H.Simpson)于1951年提出的悖论,即在某个条件下的两组数据,分别讨论时都会满足某种性质,可是一旦合并考虑,却可能导致相反的结论。( Q7 s# Y  f% y
有一个非常有趣的故事来解释该悖论:
; }. P3 U. r  r& m# m4 h0 d在一次教职工大会上,一群老师想要知道让学生获得最好学习成绩的最佳学习时间长度。+ a* ^& y- ^% q. @/ {. |: w: M7 y
因此,他们决定收集学生学习的时间数据,然后与学生的考试成绩进行比较。; L3 l% I* h% @' _5 ~5 C4 P1 A+ H
因为事先相信更多的数据会意味着更好的结果,所以所有的老师都提供了他们的课程学时数据进行分析。也就是说,不同学科的数据被放在了一起进行统计分析。* m( C1 A! S; j/ g) D
然而,最后却得到了一个负相关的结论,以及一个强烈的负相关系数——-0.7981
. V3 I9 y; k% S0 A6 R$ T0 d5 z) y3 y. ~7 C: }
有哪些有趣而著名的悖论?-1.jpg
# J7 r5 _8 `# f/ N; g很明显,这个结论是违背认知的,当然也是绝对错误的2 H# H$ L% u3 z3 \. \( a/ y3 N: C% n- ^
那么问题出在了哪里?0 d" m' u4 _- V8 Q! H) G) W# R
答案是:不应跨学科整合所有数据,而应该分别分析每门课程的数据
- O$ p/ S8 P4 i, A6 n例如,当单独分析体育学科时,结果如下:7 A5 a) N( E- g+ j: l2 E+ {; P

& b" e8 t9 m5 j: G 有哪些有趣而著名的悖论?-2.jpg ! P5 w2 ?2 G2 m& e6 u; S- y: D
一个正的相关系数——0.6353: M$ V% g& O" x
这就是一种统计现象,即当引入第三个或多个混杂变量时,前两个变量间看似强关联的数学关系就会消失,有时候甚至发生关系的逆转。
4 g; r0 F. A# x4 }随后,统计人员重新绘制了所有数据,和之前不同的是,每门课都用不同的颜色进行了标注,结果如下:
% K! e) ~) R2 ~8 g5 R. l
0 m$ p' s! v& ^+ L9 A0 w9 X) { 有哪些有趣而著名的悖论?-3.jpg
) h% J$ U9 r# d( ~# q可以看到,每门课的学习成绩和学习时间都是正相关的
: Z3 [8 `, q7 y+ }) Y然而,总体上来看,这两者却是呈现负相关的。在数据分析过程中,学习成绩和学习时间这两者的关系被完全的颠倒了。
- C& |8 f5 f# R) z  u, A& j& @( S: v; a$ e
有哪些有趣而著名的悖论?-4.jpg
4 P. k( S& e, H; M: L# S/ L) x0 J+ C8 L6 d! Y8 y
这就是所谓的辛普森悖论3 {6 R8 l3 X; ?6 `
以上,谢谢
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

223

金钱

0

收听

0

听众
性别
保密

新手上路

金钱
223 元