有哪些有趣而著名的悖论?

[复制链接]
查看3440 | 回复0 | 2022-3-19 16:17:14 | 显示全部楼层 |阅读模式
分享一个有趣的悖论:辛普森悖论
; Y) s" {( o, s" X2 f辛普森悖论为英国统计学家E.H.辛普森E.H.Simpson)于1951年提出的悖论,即在某个条件下的两组数据,分别讨论时都会满足某种性质,可是一旦合并考虑,却可能导致相反的结论。7 C# Z6 T  Y* z, P
有一个非常有趣的故事来解释该悖论:2 R9 v) m$ k# b4 s0 r; }  d
在一次教职工大会上,一群老师想要知道让学生获得最好学习成绩的最佳学习时间长度。; s- x) s1 ?5 ?; X+ X4 |# c
因此,他们决定收集学生学习的时间数据,然后与学生的考试成绩进行比较。
. O# i" d" e- O. X" Q8 |7 M因为事先相信更多的数据会意味着更好的结果,所以所有的老师都提供了他们的课程学时数据进行分析。也就是说,不同学科的数据被放在了一起进行统计分析。8 M  x+ W% q1 b$ @5 W. j) ^
然而,最后却得到了一个负相关的结论,以及一个强烈的负相关系数——-0.7981
/ X5 A) m4 g8 N9 ]; `" v/ Q, J" b- j: Y& B& Y$ W! H9 Z
有哪些有趣而著名的悖论?-1.jpg + K$ \# B5 N/ Y
很明显,这个结论是违背认知的,当然也是绝对错误的
1 u  t2 w  v2 Q: y# ?那么问题出在了哪里?
! F, \0 h) s( Z" W$ u答案是:不应跨学科整合所有数据,而应该分别分析每门课程的数据) n& u1 Q* b$ W9 l
例如,当单独分析体育学科时,结果如下:- c. w' C& W8 }6 ~6 o: J8 y0 Q2 z5 c
& @' Q( [8 I9 A1 i$ Z9 n5 y
有哪些有趣而著名的悖论?-2.jpg ; b/ l" n* b7 s1 U
一个正的相关系数——0.6353
2 b2 |( u* u/ Y& B2 Q0 v这就是一种统计现象,即当引入第三个或多个混杂变量时,前两个变量间看似强关联的数学关系就会消失,有时候甚至发生关系的逆转。+ i& w1 }% ]% W7 }- {
随后,统计人员重新绘制了所有数据,和之前不同的是,每门课都用不同的颜色进行了标注,结果如下:! Q9 o- N: s: E2 w
- C/ c9 x* i9 y# M# T) D
有哪些有趣而著名的悖论?-3.jpg   |1 r7 x, K) a. T
可以看到,每门课的学习成绩和学习时间都是正相关的
6 _9 ]3 V( M* n$ a然而,总体上来看,这两者却是呈现负相关的。在数据分析过程中,学习成绩和学习时间这两者的关系被完全的颠倒了。
: b5 D8 N7 N0 o) t  I4 a' [' _
2 b5 v2 q+ }! U+ C: d 有哪些有趣而著名的悖论?-4.jpg
# ^2 D0 b- T, p
9 L( g: |& g  ]% {5 Y. v" B这就是所谓的辛普森悖论
0 I7 c* o9 k7 I* y以上,谢谢
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

223

金钱

0

收听

0

听众
性别
保密

新手上路

金钱
223 元