有哪些有趣而著名的悖论?

[复制链接]
查看3416 | 回复0 | 2022-3-19 16:17:14 | 显示全部楼层 |阅读模式
分享一个有趣的悖论:辛普森悖论& |0 Y0 R, K/ J; s3 d; I$ u8 z9 ^
辛普森悖论为英国统计学家E.H.辛普森E.H.Simpson)于1951年提出的悖论,即在某个条件下的两组数据,分别讨论时都会满足某种性质,可是一旦合并考虑,却可能导致相反的结论。% }; ?) b, g9 \
有一个非常有趣的故事来解释该悖论:
- h% U" E% p) L  z  I2 a在一次教职工大会上,一群老师想要知道让学生获得最好学习成绩的最佳学习时间长度。: L7 i; i/ c7 c, H2 P5 u8 x! v6 \
因此,他们决定收集学生学习的时间数据,然后与学生的考试成绩进行比较。
7 ?/ b' x& C0 O' I6 i; `4 O. Y/ {( I因为事先相信更多的数据会意味着更好的结果,所以所有的老师都提供了他们的课程学时数据进行分析。也就是说,不同学科的数据被放在了一起进行统计分析。
* H% O$ q: N6 p然而,最后却得到了一个负相关的结论,以及一个强烈的负相关系数——-0.7981; `& r( v& I% Y# G# |1 e7 M5 f3 v
5 N/ G6 Y+ j; q! b* m5 I* Z
有哪些有趣而著名的悖论?-1.jpg
2 g$ x8 y" ]* E1 u' p* l很明显,这个结论是违背认知的,当然也是绝对错误的- J+ y8 Y/ Y- x" F( r
那么问题出在了哪里?! K+ l% U+ d# ]8 i1 z) p' V* i
答案是:不应跨学科整合所有数据,而应该分别分析每门课程的数据0 q4 C" ?7 s, v- D( T4 @
例如,当单独分析体育学科时,结果如下:% e* T' a# X& p% G6 P7 s

% ~; R, Y2 q% T4 L0 W* q7 L. F 有哪些有趣而著名的悖论?-2.jpg
; L+ p5 G+ C% S0 Z一个正的相关系数——0.6353' j) c5 x3 h2 |4 w
这就是一种统计现象,即当引入第三个或多个混杂变量时,前两个变量间看似强关联的数学关系就会消失,有时候甚至发生关系的逆转。. m+ x1 ~  p( q3 J
随后,统计人员重新绘制了所有数据,和之前不同的是,每门课都用不同的颜色进行了标注,结果如下:5 F/ Y, y, A& {) A
3 J; Q9 Q4 }/ h
有哪些有趣而著名的悖论?-3.jpg * E4 z9 r! }) Z5 A# s
可以看到,每门课的学习成绩和学习时间都是正相关的
+ q& z: `2 x& y2 `" B7 [然而,总体上来看,这两者却是呈现负相关的。在数据分析过程中,学习成绩和学习时间这两者的关系被完全的颠倒了。
1 e& P3 l! A8 M4 I/ w. \/ h
5 h  i  d* n' i+ r+ q7 v 有哪些有趣而著名的悖论?-4.jpg : x) A1 a. A3 _6 i4 A8 z
8 j# Q+ b) D- V3 w% _
这就是所谓的辛普森悖论, x+ V( R& F3 z$ R  f
以上,谢谢
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

223

金钱

0

收听

0

听众
性别
保密

新手上路

金钱
223 元