度量模型的证实和度量误差的估计

有用的度量是那种预期用来度量事物的度量。即使它确实度量了所要度量的事物,它也可能度量得很糟糕。因此,我们需要认识使用某种特别度量时所包含的误差。证实和误差的估计为我们提供一种检验特定度量模型的手段,为我们提供有关那个特定模型在预期工作中表现如何的信息。

不言而喻,评价一种特定度量的有效性不可能不考虑它的目的。因此, 证实就是指关于某一特定度量模型在一定情况下表现如何的经验评价。纳内尔利(1967,第三章)提出检验确实性的三个方法,每个方法所适用的环境大不相同。当度量的目的是为了估计另外的事物时,就涉及到预测确实性。入门检验是一个典型例子,它企图度量未来的情况(学校中智力划分的智商检验等)。这种度量的证实,其实有赖于已定度量与某种未来情况度量之间的关联。内容确实性则较难评价,因为既然认为这种度量是关于某种属性的直接度量,这种度量就不能通过与另外事物的关联来检验。在这种情况下, 我们不能通过检验度量的结果来证实度量,但是我们可以通过检验涉及到所了解的被测对象性质的数学形式和运算步骤来证实它。这是对度量方法设计的彻底检验——一种作为度量先兆的小型实验设计方法。这种证实方法的目的,在于保证度量仅仅与被度量的属性有关(即无任何其它干扰力),并保证以不偏不倚的方式度量属性。构想确实性更难评价,因为在这里我们基本上只涉及度量抽象构想——效用、满足、动机等的问题。这些理论构成物(观念化)适用于一定的行为范围。例如,效用是一个用以包括人们在几个选择对象中挑选一个或者实施这种选择的情况的概念。在度量这种构想时,我们倾向于选出考虑该构想要支配的领域的一个方面,并对它作某种实验,将其结果看作对构想本身的一种度量。例如对于效用,经典方法是企图通过在博奕情况下行为打赌的方式来分析它(冯·诺伊曼和摩尔根斯坦,1964;费希本,1964)。当然,这里有一个巨大的归纳假设,因为假设我们正在度量效用,而不仅仅是在博奕情况中的行为打赌。关于构想本身,我们了解得越多

(即我们越能更好地定义其范围),构想证实将越容易,因为那时,对它的范围,我们可以有好多供选择的情况,而且能显示出各种度量的相互关系, 可能会出现一两种为我们提供所需信息的方法。但是,构想证实是一件复杂的事情(纳内尔利,1964,83—99),要证实的问题数不胜数。但若无朝这个方向的某种努力,我们很可能会发现自己曲解了所作度量的含意。对这个问题的详尽说明,可在纳内尔利(1967)、库蒙帕斯(1964)、吉色利(1964) 和托格逊(1958)写的参考书中找到。

所有类型的度量都易出误差,而误差的大小影响到度量在特定情况中的可用性。当然,理想的情况是:含有的误差量小到对特定目的可予忽略不理。因此,度量误差的意义不能独立于目的之外,阿科夫(1962,205—14)列举了四种度量误差来源:

  1. 观测者误差。起因于观测者不能完全使自己从度量过程中摆脱出来。在自然科学中,观测者误差主要归因于细微辨别感不足,因此利用误差正态曲线来估计真实度量。但是在社会科学中,各种误差的产生,与调查者

在研究其他人时不能使自己摆脱所问的问题有关。观测者常常设想自己处身于度量情形中,因此度量可能含有观测者的偏见(韦布等人,1966)。这种情形中的误差显然不能认为是随机的,相反,它是系统的。

  1. 仪器误差。起因于所用仪器的偏倚性。某只温度表可能没有充分校准,某台天平可能出细微差误,如此等等。没有一台仪器是完美无缺的,因此显然需要有关仪器灵敏度和所含误差等级的信息。

(c )归因于环境的误差,当环境状况变化,从而影响观测者、影响仪器、影响被观测的事物时产生。温度的变化可能影响长度测量,信贷限制的变化可能改变一个人对地方效用的观点(因为影响了他迁移的可能性),湿热的日子可能影响观测者和被观测者阶感觉到的应力。实验设计的作用之一,就是要控制此类误差,但在非实验性科学中,这种控制是极其困难的。同样,对所涉及的误差也需要有某种估计。

(d)归因于被观测者的误差。既可由于被观测事物的内在变化性产生(例如人们随时间流逝而改变他们对地方效用的观点,甚至傍晚的想法可能与早晨的想法不同),也可因为被观测事物的行为受观测者行为的影响而产生。后者的典型实例是海森堡系统阐述的物理学中测不准原理。在社会科学中, 测不准原理的出现非常普遍,尤其是在询问工作中。既然观测者和被观测者处于一种高度相互作用的情景中,会见者要想不影响被会见者是不可能的。可以采取一些控制措施,但很难使误差消除或成为非系统误差。一个热情的访问者与一个玩世不恭的访问者所得到的结果可能很不相同,而回答者都有一种投访问者所好的扰乱性习惯。

这四种误差来源是任何度量方法都固有的,而且它们可能全部结合起来导致产生相当大的误差。通过仔细的设计和仔细地操作既定度量,有可能减小误差(例如对度量作误差筛选),但很难将误差完全消除,而这种程度的误差必然影响一定度量方法诸使用的可能性。摩尔根斯坦(1965)《关于经济观测的精度》的评论,对经济统计学中涉及的误差多有论述,而且总结道: 这种程度的误差多半使若干已付诸使用的度量无效。因此,注意度量误差是极其重要的。正如阿科夫(1962,214)所说:

误差的不断减小⋯⋯是科学的一个主要目标,也是衡量科学进步的主要标尺之一。