有哪些有趣而著名的悖论?

[复制链接]
查看3439 | 回复0 | 2022-3-19 16:17:14 | 显示全部楼层 |阅读模式
分享一个有趣的悖论:辛普森悖论
! `* z. K7 M( J: [, c, e" j8 u辛普森悖论为英国统计学家E.H.辛普森E.H.Simpson)于1951年提出的悖论,即在某个条件下的两组数据,分别讨论时都会满足某种性质,可是一旦合并考虑,却可能导致相反的结论。
; u' }4 v/ b- y( R有一个非常有趣的故事来解释该悖论:) Y- Q, s" Y- ~4 [% {
在一次教职工大会上,一群老师想要知道让学生获得最好学习成绩的最佳学习时间长度。- [1 c0 P* e1 y
因此,他们决定收集学生学习的时间数据,然后与学生的考试成绩进行比较。- m' g% Y* a* b+ C1 e
因为事先相信更多的数据会意味着更好的结果,所以所有的老师都提供了他们的课程学时数据进行分析。也就是说,不同学科的数据被放在了一起进行统计分析。
; p: ?; U+ i( o$ T4 {; h然而,最后却得到了一个负相关的结论,以及一个强烈的负相关系数——-0.7981
5 ]8 T) s0 a" A1 G& ~# V% t( m7 z( o2 ]; K; F9 M' |
有哪些有趣而著名的悖论?-1.jpg
6 d6 Y$ U4 n3 T0 k: ?% \! B& E很明显,这个结论是违背认知的,当然也是绝对错误的% m: O& ~$ t# Q3 b  N1 E$ Q
那么问题出在了哪里?' U" H7 d5 M9 @
答案是:不应跨学科整合所有数据,而应该分别分析每门课程的数据
4 H0 t* F; s. _5 h9 ?( E4 c" ~例如,当单独分析体育学科时,结果如下:7 D' o/ C+ i8 P* L+ N
+ @" J# k* T& R7 j9 X: y
有哪些有趣而著名的悖论?-2.jpg . w1 C1 T4 r5 P" ?9 ?& y7 T& N
一个正的相关系数——0.6353
/ E: m5 ~) D9 F8 I. t这就是一种统计现象,即当引入第三个或多个混杂变量时,前两个变量间看似强关联的数学关系就会消失,有时候甚至发生关系的逆转。
* Q7 `! E" w4 J' r; N1 E随后,统计人员重新绘制了所有数据,和之前不同的是,每门课都用不同的颜色进行了标注,结果如下:
/ U- F8 i* N  ?2 @# E+ _% y* u- r" R  S! H! t$ p
有哪些有趣而著名的悖论?-3.jpg $ ]8 A: y3 [. N2 [# [/ y' j1 x
可以看到,每门课的学习成绩和学习时间都是正相关的
) H  h' d- {- L' }" ~4 f然而,总体上来看,这两者却是呈现负相关的。在数据分析过程中,学习成绩和学习时间这两者的关系被完全的颠倒了。$ f7 ^; x, O+ k
0 u- e: ^7 H! O! C0 ?
有哪些有趣而著名的悖论?-4.jpg
9 N9 s" \" P/ I4 ^0 K* r& s$ d' F& @( |9 p4 E9 ^
这就是所谓的辛普森悖论8 D7 ?4 a6 f0 }4 i- g8 o
以上,谢谢
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

223

金钱

0

收听

0

听众
性别
保密

新手上路

金钱
223 元