准确度的假象(4)

另外,非真实数字可能首先是由相加或相除这样一些数学运算造成的。例如,向非常教条的学生问:世界历史有多久远?他们对这个问题的回答是:“四千年零一个星期”。

“你从何处知道这么详细的数字?”

“嗯,上个星期我们已经学习了这方面的知识,当时世界已经有4000年的历史了。”

如果我们计算自己的财产,例如

房屋:60 000 000马克

现金:393 458马克

总共:60 393 458马克

那么,这个精确的最终结果只能是似乎准确的。因为房屋的价值仅仅标明到±50 000马克,更精确的最终结果是不可能计算出来的。

对数据做相除运算也会产生相同的表象精确度问题,即事实上是不准确的。例如,我在德国《商报》(Handelsblatt)上读过这样的消息:联邦德国物理学硕士平均最低年薪是66 667马克。为了说明数据的真实性,这里所使用的数据也太精确了。在这种情形下,数据也在告诉人们,它是从哪里产生的。如果这个数据不是除以200 000而是除以3得到的,那么,我想我就要灵活地去对待这个数据了。可能有3个公司同时决定雇用这个物理学者,而这个将被雇用的人只是大概回忆起,其起薪工资水平约在70 000(2次)马克和60 000马克之间。

当我们在收音机广播中听到下面的消息:一位在孟加拉国种植水稻的农民每年可以挣98马克13芬尼,这个数字完全不是有意暗示这个调查研究会精确到一分一毫,因为事实上人们从来没有这样计算过。研究者只是做了一个猜测,即9100万居民平分20亿塔卡的国民收入,然后再按照当时的塔卡与马克的汇率换算成马克,从而得出上面的结论:98马克13芬尼。在这些附加的资料中,只有一项是精确无误的,即当时的货币汇率。国内生产总值和居民数量都是粗略的估计。如果把所有资料都集中到一起,那就会重新产生出一个(被误认为是)精确的数字。

对于生活必需品的消费状况而言,统计学所给出的精确数据也是如此。如果人们相信威斯巴登的数据收集者所做的统计工作,那么,一个由两人组成的退休家庭大约每月消费8.3升牛奶、8540克土豆、1286克牛肉、2098克猪肉。粗略的总体数字在这里也仅仅是通过除以家庭数量而“精确出来的”。

我还读到:在全世界居民中,卢森堡人以每人每天消耗3713卡路里排名世界第一。即便假设全部信息都是精确的,那么这些数据也是不准确的,因为联邦德国都排到30名之后了,这明显与事实不符。所以这个结果肯定说明数据存在问题。

在卢森堡这样的国家,错误可能是由旅游者的消费导致的,原因在于统计学者经常把销售等同于消费。从卢森堡每人每天消耗3713卡路里这个数据来看,肯定有数以百计的卡路里被旅游者消耗掉了。当时卢森堡招致了吸烟者国际联盟的不满,这主要不是因为卢森堡人是非同寻常的尼古丁依赖者,而是因为价廉物美的香烟大量出售给外国人。因此我们能够得出结论,一个生活在黑森州地区的家庭,平均拥有20个布谷鸟钟(基于同样的原因,其中一些布谷鸟钟被旅游者买走了)。

专业的数据收集者自然能够完全准确地知道这种误差。也就是类似下面的表述:在下个星期日的选举中,某个政党X将会得到38%(±1%)的选票。换句话说,选票比例将在37%~38%之间。我们必须注意到,这个结果还是不确定的,因为它仅仅是指具有某种可能性而已,尽管这种可能性是巨大的。由于我们不太喜欢阅读小号字体印刷品,所以我们经常“粗鲁地”剥掉数据表面所有的包装,原因在于这些隐藏在不必要的指标后面的数据,当它们初次表现出来时通常远远是不精确的。

参考文献