有哪些有趣而著名的悖论?

[复制链接]
查看3441 | 回复0 | 2022-3-19 16:17:14 | 显示全部楼层 |阅读模式
分享一个有趣的悖论:辛普森悖论5 |. A% ~! U' c
辛普森悖论为英国统计学家E.H.辛普森E.H.Simpson)于1951年提出的悖论,即在某个条件下的两组数据,分别讨论时都会满足某种性质,可是一旦合并考虑,却可能导致相反的结论。
9 Y3 `$ Z3 V$ D2 E( D% j, M* }" ~9 B有一个非常有趣的故事来解释该悖论:
' b/ J. P% E# i在一次教职工大会上,一群老师想要知道让学生获得最好学习成绩的最佳学习时间长度。
# d6 o0 Y6 G& t2 o! d; j. i因此,他们决定收集学生学习的时间数据,然后与学生的考试成绩进行比较。
! }- P& c/ R9 `0 I& \8 M因为事先相信更多的数据会意味着更好的结果,所以所有的老师都提供了他们的课程学时数据进行分析。也就是说,不同学科的数据被放在了一起进行统计分析。5 L  Z9 V* ]$ ~
然而,最后却得到了一个负相关的结论,以及一个强烈的负相关系数——-0.79816 E& ^8 i) D' T9 i  A/ G: A

- w' _6 r( d2 s6 ?$ U 有哪些有趣而著名的悖论?-1.jpg   L: B1 [) O' l2 M0 e% z
很明显,这个结论是违背认知的,当然也是绝对错误的; t, G3 B5 Y5 f% F8 H2 A7 y
那么问题出在了哪里?
1 C" f5 r' W( f) L" i9 J/ }答案是:不应跨学科整合所有数据,而应该分别分析每门课程的数据
4 m" c. r3 R' c0 ]例如,当单独分析体育学科时,结果如下:4 ?9 w$ X9 D/ S) M$ E
* M4 x) E. K8 y, I% `1 s0 p
有哪些有趣而著名的悖论?-2.jpg
0 B& V( u! u4 R4 R2 U一个正的相关系数——0.6353
: E! j# e" l  a: d& z" `这就是一种统计现象,即当引入第三个或多个混杂变量时,前两个变量间看似强关联的数学关系就会消失,有时候甚至发生关系的逆转。9 c9 g9 g# l- A/ v$ t
随后,统计人员重新绘制了所有数据,和之前不同的是,每门课都用不同的颜色进行了标注,结果如下:7 t, W& ?$ H0 Q

/ S/ [( u. p8 z4 | 有哪些有趣而著名的悖论?-3.jpg
" p6 [7 M( j3 h2 o可以看到,每门课的学习成绩和学习时间都是正相关的
$ a  e; |2 m& G& Y! @# |+ x然而,总体上来看,这两者却是呈现负相关的。在数据分析过程中,学习成绩和学习时间这两者的关系被完全的颠倒了。' ]/ N& o) }- M4 o8 ^
1 X* \1 Q' [' m+ y
有哪些有趣而著名的悖论?-4.jpg , z' Z5 y' x- I1 X: H7 U

' y, L# }- ]( ?: G1 M" C这就是所谓的辛普森悖论
# B/ b! x4 M+ ~6 [; i以上,谢谢
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

223

金钱

0

收听

0

听众
性别
保密

新手上路

金钱
223 元