福州腮红价格联盟

参数与非参数之辩

统计算个P2018-03-08 08:29:55

       非参数检验作为参数检验的补充,主要适用于当参数检验所要求的条件不满足时的情形。参数检验一般都需符合一定的分布,然后根据这种分布的相应公式直接计算即可。

        例如,符合正态分布,就套用正态分布的公式。好比数据是一个圆形,那我就用圆形来套用,甚至用一个椭圆形的套用也差不多。但是用一个三角形套用就不合适了。 如果套用成功,由于形状相似,计算圆形的面积或周长就比较简单了(这里的面积和周长就是所谓的参数)。

 

        但是,如果数据是一个不规则的形状,无论用圆形、三角形、椭圆形、方形等套用都不合适,那就没有办法了。这种情况下,就只好采用非参数检验了。即不要求数据服从任何分布,仅利用数据本身进行检验。由于形状不同,就不能根据圆形、三角形等的计算公式来计算面积或周长了。

 

        非参数检验有自己的一套理论和方法。如果数据符合某种特定分布,这时候采用参数统计分析比非参数统计分析的效率要高。所以如果明确资料符合特定分布,最好就根据该分布采用参数统计分析。如果资料看不出符合某种分布,就可以采用非参数统计。

        多数人都喜欢参数检验,这更多的是一种心理上的原因,当我们碰到一件新事物的时候,总希望能对他们稍微有些了解。丝毫不了解的事物我们会恐惧、茫然无措。比如鬼魂,我们不知道他是什么样子,无从描述。非参数检验也是一样,我们对数据丝毫不了解,不知道他是圆的还是方的,所以很困惑,总觉得无从下手去分析。

        从一些统计学家的传史中发现一个有意思的现象:原来当初发明Wilcoxon秩和检验的Wilcoxon并不是个统计学家,而是个化学家,他在化学研究中发现总有一些极值影响分析结果,但这些极值是客观存在的,又不能轻易删掉,所以他就想办法来处理,结果一不小心成了统计学家。原创了Wilcoxon秩和检验方法。后来Mann和Whitney又合创了Mann-Whitney方法,结果发现与Wilcoxon结果差不多。

        非参数检验时,我对数据什么都不用了解,就是直接看数据本身,将数据的散点图与纯随机分布的情形比较,就知道结果了。很多人对非参数检验存有歧视,总觉得他好像只是一个杂志的增刊,不够正式。

        早在上世纪40年代的时候,皮特曼就发表了一篇文章,建立起有关参数与非参数方法的关系逻辑。他非常惊讶的发现,即使数据符合正态分布,非参数检验的结果也几乎和参数检验一样的完美。而一旦数据稍微偏离参数模型,非参数检验的结果将远远优于参数检验。

        这一结果令人吃惊,是吗?但这不是巧合。很多东西都不会像我们想象的那样令人一目了然。一般人的眼里,似乎参数就是好的,非参数是不好的,但实际情形却并非如此。很多我们想当然的结果并不一定是真相,有可能只是我们的想象而已,就像当年亚里士多德所说的“重的物体理所当然比轻的下落的更快”。所以我们对任何事情,一定要有自己的主见,而不要凭想当然来判断。

        当年的Wilcoxon并不是学统计学的,皮特曼也是后来改行学统计学的,当初他们在一无所知的情况下也能成为今天统计学教材上的人物,为什么我们有更多资源利用却无法学会统计学呢?我相信更多的是个人因素,而不是客观因素。难道我们的条件比20世纪的Wilcoxon和皮特曼更糟糕?