《品茶》读后感( 四 )


由于显著性检验的功能在数据分析中的重大作用,显著性检验得到了广泛的应用 。然而在应用之前,首先了解各检验方法的适用范围及其特点是正确使用检验方法的基本前提 。许多统计检验方法的应用对总体有特殊的要求,如t检验要求总体符合正态分布,F检验要求误差呈正态分布且各组方差整齐等等 。这些常用来估计或检验总体参数的方法,统称为参数统计 。许多调查或实验所得的科研数据,其总体分布未知或无法确定,这时做统计分析常常不是针对总体参数,而是针对总体的某些一般性假设(如总体分布),这类方法称非参数统计,相应的,统计检验总体分为参数检验和非参数检验 。在选择参数与非参数检验时,首要考虑是数据的分布情况,能确定分布类型的,则可适当选用参数检验,参数检验主要包括包含的方法有:单样本T检验、两独立样本T检验、两配对样本T检验;非参数由于不限制分布,统计方法简便,适用性强,但检验效率较低,应用时应适当加以考虑,非参数检验主要涉及单样本、两独立样本、两配对样本、多独立样本、多配对样本五个方面的非参数检验 。不同的检验方法,比较的统计量是不同的 。T检验等检验方法都是比较均值;卡方检验、K-S检验等比较频数;曼-惠特尼U检验等是对秩进行比较;符号检验法比较的是前后变化差值的符号 。因此,只有了解各检验方法的基本思想及特点,才能正确选取适当的检验方法 。其次,认清研究目的 。研究目的是调研中一切实务的根本出发点,做数据分析时同样首要考虑的是研究目的,研究目的也是数据分析的方向,但此时研究目的需要细化,具体到要通过哪些数据,得到什么信息,取得何种结果 。例如:希望通过对消费者购买哪些品牌的数据来得出市场占有率的信息 。具体的实际应用中,灵活运用检验方法是关键 。检验方法虽然有各自特点和适用范围,但是可以对数据做稍微的处理、变化,或是换个角度分析,便可运用不同的检验方法;且各方法有适用范围,当然也有它的局限性,有时需要多种检验方法配合使用,相互补充,才能充分地挖掘信息 。例如:独立样本T检验法判断AB产品对于抗过敏的功效评价在均值上是否有差异,而卡方检验可判断他们在各评价水平上的分布有无差异,假如判断出他们功效水平无差异之后,我们还想知道他们到底是同样的好还是同样的差,这时可以再使用单样本T 检验对与均值评价水平相近的满意度水平进行差异性检验来进行定位 。此外,我们还需要合理解释检验结果 。不仅要正确识别检验结果,还需要结合原始数据及实际意义,并针对研究目的来分析说明 。
在统计模型的数学和技术层次之外,本书花费了大量心血来表达统计革命的观念和世界图景的新思考 。这方面贝叶斯层次模型对理解统计观念十分重要:理论实体是统计分布,这是变化和影响的基本实体 。而理论实体是实际不能直接测量的,我们只能得到它的尽可能好的估计值 。作者在本书中当然默认了实在论的认识前提,集中在作者对于物理学实验和物理学理论工作模式的理解 。比如作者对混沌理论的批评,他认为混沌依然是决定论的产物,在现实中他更相信统计模型 。物理学是很多套数学模型,有确定性的,如牛顿经典力学体系;有概率特征的,如量子理论 。用哪个模型来描述问题完全看问题处于哪个层次从而导致问题的哪个方面更为主要从而决定使用哪个模型来进行描述 。混沌理论最初是在经典力学模型中发现的内在随机性,是经典力学模型的内在性质 。而后来的发展又在随机性的量子理论模型中发现了量子混沌现象,混沌不是一个理论模型,而是模型的性质,决定论的模型和随机性的模型都会出现,如果认为量子理论是随机性的模型的话 。但是我认为,按照统计革命的思想,量子理论算不上随机性的模型,这个比较深层的疑问,也许后面会再谈到 。所以作者关于混沌的评论和将其与统计模型的比较本身就是不适当的 。混沌理论与随机性相关的另一个问题在我看来始终是一个困惑,即多体系统的随机性与少体系统的随机性本质上如何区别,多体系统比如阿伏伽德罗常数个分子的统计行为,是统计力学处理的对象 。在这种情形即使个体的行为可以精确追踪也是没有意义的,理论不需要对个体的了解,只需要大数统计行为就可以预言系统的宏观性质 。在经济社会系统里统计模型的大量应用就是源于这些系统是天生的多体系统,社会学经济学等社会科学的困难尤其是应用物理学方法进行研究的困难正在于此,物理学分析多体问题的方法还不够 。处理大数问题,自然要用统计,但是对于少体系统的内在随机性问题就是另一种机制了,在三体问题牛顿方程组中混沌现象的发现是一种全新的模式——高度非线性的效应,而不是大数效应导致的随机性 。但是这两种机制不同的随机性的数学描述,应该完全有可能统一进行 。本书涉及到许多统计观念在现实问题中应用的例子,或者说是在用统计模型处理现实问题中引起困惑的观念问题 。比如对统计相关性的理解 。最著名的例子是费歇尔对吸烟与肺癌关系的统计分析所持的态度 。他认为吸烟与肺癌有关的统计分析都是站不住脚的,从分析的角度看,他的天才是令人惊异的,统计相关性一直受人诟病,原因一方面在于作者多次提到的大部分使用统计方法的人实际上并不真正理解统计方法的思想,误用和死板硬套的情况普遍存在;另一方面也在于统计相关性的结论与因果性的关联之间存在问题 。既非充分也非必要的统计相关性意味着什么,为什么人们还是需要因果性的追寻?另外关于统计模型本性的思考,最重要的问题我认为有两个,一个是为什么它这么重要,竟能形成一个庞大的学科,这个学科的地位究竟又如何 。这个问题我的理解是因为20世纪以来多体模型被普遍研究,自然需要统计学方法 。作为一个学科是没有必要的,只是数学模式的一种,借由广泛的应用才如此受人热捧,这样就消解了似乎笼罩在它头上神圣的光环 。这个问题很简单,是一个社会学的问题,只是有些内行学者喜欢抬高自己工作的意义,而很多外行也不懂,被一些富有煽动性的书籍和炙热的感情迷惑了 。另一个问题是真的问题,一个科学和思辨的问题:统计相关性与因果相关性的关系 。传统的理解,包括本书中许多统计学家也持这种观点,即认为统计相关性是唯象的,在得到统计相关之后还需要进一步分析因果性,是什么因素导致了统计相关 。如果持有这个观点,很难说是真正理解了统计革命 。因果性是还原论,决定论思维的特征 。一个弱化的版本是统计相关与因果相关的融合——只存在统计意义上的因果性 。这依然是一种经典的思维模式,可不可能本来就不存在因果性,本质上就是统计相关性?或者更学术的表述应该是是不是统计相关性是更不建构的东西?我本人倾向于做这种理解并寻找支持这种理解的东西,不去做因果性的分析,因为那本来就没有根本的意义 。另外一种可能是统计相关和因果相关是两种并行的事物之间相关的模式,但这似乎不大可能 。在这一问题的基础上,我想是不是可以借由进一步的统计理解来推进突破还原论决定论的思维 。如何才能学会整体论的思维呢?自然界在哪里可以给我们提供一些启示?本书除了费歇尔以外作者最推崇的天才就是柯尔莫哥洛夫和约翰图克,前者的广博才华人所共知,而后者是不可思议的高效和深刻结合的天才,强烈的好奇心和难以抑制的原创冲动 。他思考了一个看起来只能存在于哲学思辨中的问题:人类思维倾向于发现模式,那么在多大程度上可以用倾向于模式的目光去检验数据,此基础上发展出探索性数据分析这一套方法 。作者在书的最后一章里提出了一些很困难的有关统计和概率的哲学问题,统计可以脱离概率理论吗?概率在现实生活中是什么意义?统计理论的内在一致性问题等 。作者曾说:在现代世界观的基本假设中,哪些可能在500年后看起来是很荒谬的?