数据如何误导了我们读后感精选(11)


关于数字对我们的影响体验最深刻的,大概是学生时代的每一次考试成绩以及成年后的工资数目吧 。不管是成绩,还是长大后的薪资数目,甚至都能决定一段时间里我们的喜怒哀乐 。
可是如果我们看见的数字是不真实的,我们的人生会不会也在往一种更加糟糕错乱的方向前进呢?
很多时候,任何数据都不足以衡量我们的付出与价值 。更关键的是,我们很可能完全意识不到自己正在被数据推着走,而这些数据实际上错得离谱 。数字本身是中立的,客观的,但数据背后的人却是复杂的,因为直觉,认知偏差或者利益相关等原因 。
我们经常会用平均值来表示整体在某个方面的表现,比如班级里某一次考试的平均成绩,但使用平均值也会有很多的局限性 。我们需要意识到这方面的误差,一个有趣的笑话可以提醒我们这一点——
作者提到了一个概念——“物化”,意思是人们创造了一些概念,然后自己却忘记了这是人为创造出来的,反而相信它一直存在于社会之中 。
智商测试能在多大的程度上判断一个人的智力呢?实际上更加严谨的说,那个成绩只能从某种程度上代表我们的抽象思考能力(因为大多数测试题是以抽象思考题为主的) 。或者更直接地说,我们的成绩越来越好并不是因为我们变聪明了,只是因为我们做那些题更加熟练了 。
“古德哈特定律”表示,“如果一项指标一旦变成了目标,它将不再是个好指标了 。”言下之意是数字是可以被人操纵的,比如在数据上作弊,或者调整自己的行为达成某些指标 。当有些人觉得一个数字看起来就足以认清事实了,多余的那些数字就可以被抛诸脑后了 。
必须承认在数字的背后,其实可能还有很多信息没有展现出来 。过分地相信你所看见的数字,可能会让你停止深入思考,从而错过真相 。
人们还常常混淆相关性和因果关系这两个概念 。由于两个事物之间存在着某种联系,人们便会自动认为是其中的一件事导致了另一件事 。存在三种类型的“伪因果关系”——
1,只是一个偶然事件 。据研究表明,有诸多食材在相关的癌症研究当中得出过完全矛盾的结论,不管是西红柿、茶叶,还是咖啡、牛肉,皆是如此 。
如果你同时知道了这些互相矛盾的实验,还能轻易说到底哪个一定正确吗?科学论文领域也有一种扭曲的风气——研究人员希望在期刊上发表论文,所以就得想方设法地从数据中找到事物之间某种确切的关联,从而(故意)犯了这个错误 。
2,两件事物之间还缺少一个因素,这个因素既可以左右“起因”,又能对“结果”造成影响 。
3,关联(也可能)是反着的 。比如体重下降并不一定是导致人不健康的原因,也有可能是人生病之后才导致的体重下降 。