受操纵的平均值(1)
“如果一个人不再知道其他另外的事情,那么即使是拥有全部代数知识的人也经常会是一个傻瓜。”
—腓特烈大帝
每个人都知道什么是平均值。如果农民甲拥有3头牛,农民乙拥有5头牛,那么,每个农民平均拥有4头牛。世界上没有什么事情能够比这再简单不过了。
人们在此借助的“平均值”概念,正如在日常生活中的绝大多数情况一样,被称做所谓的“算术平均值”,就是把一个数值的大小通过其数量(即被除数)确定下来,上面的例子中就是3加5再除以2,最后的平均值是4。把大量的数据压缩成一个单独的数字,这种做法在实践过程中轻而易举就可以实现。
可惜这对于许多事情来说太过分了,并且掩盖了一些事情的真相。正如一个古老的关于统计学家的笑话所展示的那样:“两个男人坐在一间酒馆里,其中一个人吃了一条牛腿,另一个人喝了两大桶啤酒。从统计学角度来看,每个人都喝了一桶啤酒,吃了半条牛腿,但实际的结果是,一个人吃得太多了,而另一个人却喝得烂醉。”
平均值通常模糊了事实上所存在的巨大差异,原因在于它完全掩盖了平均值的离散度。如果在一个村庄中有10个农民,其中1个农民拥有40头牛,其他9个农民一头牛也没有。如果计算他们的平均数,则每个农民拥有4头牛。对于9个一无所有的农民来说,这种平均的结果只是一个苍白无力的安慰,水中捞月的梦想。很明显,在这里可能存在着两种不同的情形:一种情形是,所有这些数值是否非常紧密地集中在平均数的周围;另一种情形是它们是否四处分散,而不是集中在平均数的周围。然而,人们仅仅根据平均值指标是看不到这两种情形的区别的。
在英国的普利茅斯市,白天的年平均气温是13鸆,而美国的明尼阿波利斯市也拥有同样的日平均气温。尽管在平均气温方面两个城市是一样的,但两个地方的气候却绝对不是一样的温和与舒适。例如在英国的普利茅斯市,13鸆的年平均气温并没有揭示出这个地方一年中温度的偏差非常小这一特点;就算是在最冷的2月份,最低气温也永远是8鸆,相反,在最热的7月份,其最高气温也绝对不会超过21鸆。在普利茅斯市,从来没有冰冻和炎热的季节。“相对凉爽的夏季使得杏和桃一类的水果只有借助于荆棘形成的天然篱笆或围墙等的保护才能成熟”,旅行社的导游这样告诉我们,“而温和的冬天使得数量众多的亚热带植物能够适应当地的气候环境。作为药材的桃金娘和常绿的亚热带灌木等植物,人们几乎可以在户外的任何地方看到。”
普利茅斯市的气候条件对于明尼阿波利斯市的农场主来说,只能是一个梦想,因为这个地方在寒冷的冬天足以把人的耳朵冻坏。在1月份,平均气温通常都在-15鸆,而到了夏天,平均气温在30鸆以上,有时甚至会超过40鸆。所以,尽管两个地方的最低最高气温完全不一样,但是通过年平均气温的统计学计算,两个地方的气温在平均值的意义上却表现为没有差异的结果。
没有离散度的平均值只具有一半的价值。一般地,反映离差的度量单位能够可靠地反映平均水平的性质。正如上面的这个例子所表现的,如果只具有单一的平均值的话,这对于我们来说是无所谓的,否则,就要永远引起我们的高度注意。