第十一章 一些方法论上的思考

我们已经简略地考察了这个命题:在诸多治疗专业中,新的治疗方法似乎比旧的方法更为有效(第二章)。夏皮罗这位明智的医治者建议,“趁新药仍有疗效时,请用新药治疗尽可能多的病人”(Shapiro,1960,p.114)。这样的陈述是对运用治疗技能中非特殊因素之效力的重新认识,并且可以不确切地称之为“安慰剂效应”。行为科学家或者社会工程师可能修改了医生这句古老格言的措词,“趁新的社会变革方案仍有变革的力量时,请用新的社会变革方案解决尽可能多的社会问题。”在行为科学中,我们指的不是“安慰剂效应”,而是“霍桑效应”(Hawthorne effects)。

霍桑效应

在 20 世纪 20 年代中期,位于芝加哥地区的西部电力公司(Western Electric Company)所属的霍桑钢铁厂是贝尔系统电话公司的最大供应单位。霍桑工厂进行了一系列非常集中的实验,研究各种工作条件对工人工作成绩的影响(Roethlisberger and Dickson,1939)。

早就受到人们注意的一个变量是工作环境的照明度。在最早对照明效应的研究中,可以得知,照明度改变了,生产效率也会改变;但是效率与改变照明度这一事实的关系和照明上诸多变化的方向的关系一样密切。在这项最早的研究中,诸多改变的效果只是与实验前工人的效率水平作比较,因此, 第二个研究设立一个“无变化”的控制组看来是合乎需要的。

在第二个研究中,给控制组提供相当恒定的照明度,范围从 16 到 28 英尺烛光。实验组在三种不同照明条件下工作。其中一种照明条件与控制组大致相同,第二种照明条件约是控制组的两倍,第三种照明条件约是控制组的三倍。同预测前的效率水平比较,实验组和控制组在生产效率上都有显著的而且实际上是相同的提高。

第三个实验还是采用两个组。给控制组提供 10 英尺烛光的恒定的照明

度。开始时向实验组提供 10 英尺烛光,但有步骤地每次降低 1 英尺烛光,一

直降至 3 英尺烛光为止。这个实验的结果表明,到最后的 3 英尺烛光的水平, 实验组和控制组的工作效率水平都显示出缓慢而又稳定地提高。这不是照明技术人员所能预言的那种研究结果。

最后的也是最引人注目的研究只用两位工人。照明度降至 0.06 英尺烛光,相当于月光的亮度。工作效率仍然没有降低,这两个工人否定了眼睛的疲劳,并指出还有避免明亮灯光眩目的好处。

在斯诺(C.E.Snow)做的一系列研究之后,似乎清楚的是,照明度上的任何变化都可能导致行为上的效果,这种效果比根据了解工人环境的任何特定控制的具体效果所预言的效果还要大。为了进一步证实这种结论,再次对照明度作了一系列变化。在实验期中的每一天安装一盏新的更亮的灯泡,让工人报告对每次新的更高的照明度的喜爱程度。

然后,斯诺采用了必定是最早的一种“安慰剂控制”(placebocontrol) 的形式。如前所述,电工装上新灯泡,但这次的灯泡并不是更亮的灯泡。不过,工人对这些灯泡变化的反应恰恰如同他们对照明度确实有所提高时的反应一样。然后照明度逐日降低,工人不太喜欢这一系列照明度的变化。即使

这是一种虚假的降低,即让电工更换灯泡,但亮度完全一样,而使这种降低好像是真实的降低,工人仍旧不很喜欢这种变化。在这一系列照明变化中, 虽然工人显然偏爱更高的或假的更高的照明度,但生产效率并没有明显的变化。

尽管以工厂名字命名的霍桑效应是 40 年前的研究结果,但它在医学

(Honigfeld,1964)和工业(Rosen and Sales, 1966)研究方面的涵义只是现在才受到密切的注意。

霍桑、安慰剂和期望的效应

尽管霍桑效应这个概念为人人所接受,但是没有得到很好地理解。我们不仅不知道这些效应怎样发生作用,而且我们也不知道我们使用这个术语时指的是什么意思。有时我们用这一术语指在任何介入方案(如医学的、工业的或教育的)中都存在一些有助于引起种种变化的变量,这些变量原先并没有被认为是有效的变化动因。有时我们使用这个术语时,我们意指强调采用任何新的东西,而新东西本身又导致制定某种处理或变革程序所引起的变化。既然许多医学的、工业的或教育的变革方案是在科学探究的情景中产生的,霍桑(或安慰剂)效应这一术语有时用来指科学声望暗示的效应,这种效应有助于提高许多有计划的变革或处理方案的效能。

期望概念是可以成为这一术语多种用法的基础的一个概念。当制定变革或处理方案时,很可能就要涉及对这些方案效能的期望,而且看来有两种期望。首先是那些人的期望,他们的行为或健康要受到新方案的制定的影响。这些人是工人、病人、学生、研究对象,他们通过了解正在试行一种新方法, 来“了解”这种方法很可能对他们有某种效果,不然,它为什么值得人们花费时间或者精力去试验呢?其次是那些制定变革或处理方案的人的期望。这种期望能够影响到那些行为受到研究的人的反应,而且这是我们在本书中最感兴趣的期望。它是一种人际的期望效应,不是某人对自己行为的期望对这种行为的效应,而是某人对他人行为的期望对那种行为的效应。

奥克学校实验结果表明,人际期望效应能够发生在“真实的”教育情景中。那些教师期望有更大的智力增量的儿童比那些教师没有给予特殊期望的儿童显示出更大的智力增量。然而,除了人际期望这种具体的效应之外,还可能有一种更一般的霍桑似的效应在整个奥克学校里发挥作用。这种可能性的依据是,在基础实验年期间,控制组儿童的 IQ 显示出很大的增量(见表 7

-1)。为了比较起见,我们援引了“全面推进”(total-push)教育计划的结果。克拉克(1963)报道,三年之后,38%儿童的 IQ 增高 10 分。表 7-2 表明,在控制组一二年级的儿童中有 49%的儿童仅在一年之后 IQ 就增高 10 分,并且在控制组儿童中,这两个年级不是显示出最大增量的年级。克拉克进一步报道说,12%儿童的 IQ 增高 20 分。在控制组一二年级的儿童中,有19%儿童的 IQ 增高 20 分以上。控制组儿童的 IQ 增量之大看来足以作为某种教育革新方案的成果。

由于采用相同形式的 IQ 测验对所有儿童作了三次测验,控制组儿童的IQ 增量可能只是练习的结果。在奥克学校的实验中,不幸的是,无法排除练习的影响。为了避免练习影响,有必要在没有做过任何实验控制的一些学校中选择大量的学校。此外,使这些控制学校接受次数不等的测验,多则全部

接受三次测验,少则接受一次后测。

虽然我们不能排除应试练习的影响,但有一些思考可以削弱对控制组儿童的 IQ 增量很大所作解释的适当性。其中一种这样的思考涉及如下事实:在一年之后的一次复测中,一个儿童为了仅仅保住其 IQ 分数,就必定要能够比原先表现得更好。儿童年龄大了,就必定要表现得更好一些才能获得一定的IQ 分数。

此外,有助于削弱那种练习效应解释的适当性的一种更强有力的思考来自如下事实:随着时间的推移,儿童仅仅为了维持相同的 IQ 水平就必须有好得多的表现。因此,在只是很短的间隔之后进行的复测看来可能导致最大的练习效应。这个儿童就有机会练习预测中的各个试题,而且如果此后马上就进行复测,他只要比在预测时表现得稍好一点就能提高其 IQ 分数。他的实际年龄还没有增长到需要大大提高其成绩才能维持其 IQ 水平的地步。在基础实验年年终,整个学校参加后测仅几个星期之后三个班级实验复测时,进行了一次短暂间隔的复测。这种短暂间隔的复测由一位行政人员主持。表 10-2 表明,控制组儿童的 IQ 所增高的 2 分,可以归因于练习的影响。

这些思考表明了这种可能性:控制组儿童的 IQ 增量至少一部分是由于霍桑效应所造成的。我们说不出奥克学校研究中造成儿童 IQ 增量的是些什么因素。受联邦资助的大学研究人员对奥克学校很感兴趣,这一事实也许提高了该校教师表现出来的已经很好的职业道德水平和教学技巧水平。

霍桑、安慰剂以及期望的控制

不管是在医学的、工业的或教育的情景中,假如要评定一项革新的结果, 仅证明病人、工人或学生在革新后比革新前更好是不够的。假如这种革新没有被采用,病人、工人和学生的得益仍然比过去更大,这总是可能的。至少, 我们要知道,采用这种新方法是否要比不采用更好,因而这就需要一种不采用新方法的控制条件。但是,根据我们对霍桑效应和安慰剂效应的了解,这样一种“无处理”的控制组可能不够充分。