数据如何误导了我们读后感精选( 三 )


在我们研究数据如何误导了我们之前,我们先看一下下面的这一个关于数据的问题 。如果某种疾病的发病率为千分之一,现在有一种试纸,他在患者得病的情况下,有99%的准确率判断患者得病;在患者没得病的情况下,有5%的可能误判患者得病 。现在试纸说一个患者得了病,那么患者真的得病的概率是多少? 这是典型的数据分析题,也是我们现实生活中经常遇到的问题,毕竟这些比例都是我们现实中存在的,而且任何事情也都有一定的比例出现意外 。医院会出现误诊的情况,很多情况下真的不一定是医院人为的错误,就可能是在数据中必然会出现的,怎样避免这些数据的误差也是很多机关的难题 。还是说上面的案例,很多人看到的是:试纸有99%正确率,想当然的认为,只有试纸显示患病,那患病的概率就是99%,但其实呢?他真正患病的概率只有1.94%,是不是非常意外,为什么这样呢?这是怎样计算出来的呢?我会在文章最后解答 。从这个数据的计算中我们看到一种现象,在我们现实生活中,数据是如此的不可靠 。这还仅仅是我们自己的想当然,如果这些数据被别有用心的人使用,那就更加扑朔迷离了 。荷兰数据分析师桑内?布劳长期致力于数据研究,揭示我们现实生活中关于数字的各种陷阱,他写了这样一本书:《数据如何误导了我们》,具体分析我们现实中数据世界的误导 。看似客观冷静的数据,在我们现实的分析下,会有着千差万别的差异 。当然数据研究者不一定有着人为的倾向性,但任何研究人员都有自身生长环境的氛围,对于数据解读必然有着自己的风格 。
在数据分析界,最为人们诟病的可能就是心理学家罗伯特?耶基斯关于智商的研究,他得出的结论就是黑人的智商要比白人低,因此也以次提出了优生学来提高人口素质 。但现实情况是这样吗?当然,如果只看数据,只看当时黑人和白人的平均智商,结论是这样的 。可是这些数据分析出现了什么问题呢?先不说所有的智商都呈正态分布,必然有部分的白人比大多数黑人智商低的情况 。就是关于智商的测试题目的设计,也会有着不公平的情况 。从现在的研究就可以看出,智商测试题目是偏重于推理的,因此对于思维的训练一定能有效提高智商测量水平,这也就是现代人的智商要比一百年前高很多的原因 。现在考虑下黑人和白人的生存环境和受教育程度,在应用推理思维上的差异,在美国,这两者的差异极为明显,黑人都是远远低于白人的,这样测量出来的数据有明显差异也就再正常不过了 。不考虑这些影响因素的情况下,得出错误结论也就不可避免 。
这样的案例在我们现实生活中比比皆是,对于抽烟有害的研究,一直都在别有用心人的掌控下 。而面对着利益冲突,这种情况一定还会再现实中一直存在着,比如对于网络应用的研究,比如对于娱乐生活的研究,等等,这也是我们要警惕的存在 。