完成理智任务的成绩

在下述实验中,被试的反应与一种或另一种理智能力具有更直接的关系。沃坦伯格-埃克伦(Wartenberg-Ekren,1962)雇用了 8 个主考,每个主

考用《韦克斯勒成人智力量表(WAIS)》的“积木构图”(Block Design) 分测验对 4 个被试进行测试。每个主考分管其中的两个被试,这两个被试据说在学校里的成绩等第比另外两个被试高。尽管事实上所有主考都期望据说是获得更高等第的被试取得优异成绩,正如实验后的问卷调查所表明的一样,但在“两种”被试的成绩中没有获得任何差异。这些否定的研究结果可能部分地归因于这些主考专门努力避免他们期望的影响。因此,其中一位主考主动地设计了一种“遮蔽法”(blind procedure),不看编号名单下被试所属的“种类”。但是第二个主考虽非故意,却不知道他的一半被试的所属种类。

被试对其主考行为所作的等级评定的第二次分析表明,当主考接触据说是取得更高等级的被试时,主考以一种更友好的、更亲切的、更偏心的以及更鼓舞人心的方式对待被试,显示出更富于表情并且采用更多的手势

(Rosenthal,1964)。尽管我们可能期望这些更热情的行为影响被试的成绩, 但在所述的这项研究中没有出现。这是令人惊奇的,因为戈登和杜里(Gordon and Durea, 1948)发现,当主考更热情地对待八年级的被试时,获得的智商分数比当主考更冷淡地对待青少年被试时所获得的智商分数高出 6 分。最近,克劳(Crow,1964)发现,即使是大学年龄的被试,当他们受到比较热情的对待时,也会在完成译码任务中取得更好的成绩,这种译码任务非常类似于韦克斯勒成人智力量表中的分测验[“数字符号”(Digit Symbol)]。韦尔、科瓦尔和贝克( Ware,Kowal,and Baker,1963)的一项实验要求被试侦察信号。参加实验的被试都是现役军人。结果发现,当主试较热情地对待被试时,被试在侦察信号时明显地更加警觉,当主试冷淡地对待被试时, 被试就不太警觉。最后,萨克斯(Sacks,1952)报道了一些引人注目的结果, 在托儿所受到热情对待的儿童的智商分数要比受到比较冷淡对待的儿童的智商分数增加将近 10 分。

所报道的那些研究的共同之处是所使用的各种各样的被试给人的印象比较深刻。一般说来,事实的确如此:获得理智上更有能力的表现的是热情的主考而不是冷淡的主考。不过,在沃坦伯格-埃克伦的实验中,热情似乎没有带来差异,而且我们也没有任何权力说为何没有带来差异。她的基本结果是: 有关智力测验分数的预言不必是自我实现的,这一点也得到了雷·马尔里(Ray Mulry)在私人通信中所说的最近研究的支持(1966)。格特、马尔里、霍兰和沃克 (Getter, Mulry, Holland, and Walker, 1967)雇用了 10 个主考对 60 多个大学生进行韦克斯勒成人智力量表全部试题的测试。要求主考期望 1/3 的被试取得最好的成绩,期望 1/3 的被试取得较差的成绩,对 1/3 的被试不抱任何期望。结果表明,能够归因于主考期望的被试理智成绩没有表现出任何差异。

据我们所知,只有另外一项研究的任务是一种标准化的智力测验,探讨了主考预言的自我实现效应。那就是拉腊比和克兰萨瑟(Larrabee and Kleinsasser, 1967)所做的一项有独创性的实验。他们让 5 个主考用韦克斯勒儿童智力量表(WISC)对 12 个中等智力的六年级儿童进行测试。每个被试都要受两个不同的主考测试,其中一位主考测试双数题,另一位测试单数题。对于每一个被试,一个主考被告知该儿童智力超常,另一个主考则被告知该儿童智力低常。那些期望儿童取得好成绩的主考所获得的智商总和要比那些期望儿童取得较差成绩的主考所获得的智商总和的平均数高 7.5 分。但

这种差异可能是偶然出现的,概率是 100 次中有 9 次。如果只考虑 WISC 的操作分测验,那些被期望取得好成绩的儿童的益处不超过 3 个智商分数,而且很容易偶然发生。如果只从 WISC 的言语分测验来看,那些被期望取得好成绩的儿童的益处则超过 10 个智商分数(p<O.05)。受主考期望影响最大的分测验是信息,它的期望益处是由偶然造成的,其概率大约是 1/2000。这样, 可以看出,如果被试是儿童,主考的预言就可能是自我实现的;如果被试是成人,上述两项研究已表明这是不太可能的了。

最近,赫维茨和詹金斯(Hurwitz and Jenkins, 1966)做了另一项实验,其任务不是标准化的智力测验,而是两项标准的实验室学习测验。3 个男性主试对 20 个女性被试进行机械言语学习任务和数学推理任务的测验。要求主试期望一半被试取得较好的成绩,期望另一半被试取得较差的成绩。

在机械学习任务中,呈现给被试一列配对的无意义音节,并要求他们根据呈现的配对音节中的一个音节,回忆出另一个音节。主试出示 6 次音节配对以便被试学习。那些相信被试更聪明的主试所接触的被试取得的成绩比另一半被试稍好,尽管这种差异在统计上没有显著意义,而且数量也不大;那些据说是更聪明的被试学到的音节比另一半被试学到的音节多 11%。然而, 在据说是更聪明的与据说是更迟钝的被试之间,配对无意义音节的学习曲线确实表现出了差异。在 6 次呈现的过程中,“更聪明的”被试的学习成绩比“更迟钝的”被试的学习成绩明显地一律上升或逐步提高。就准确回忆与出示次数之间的等级相关系数而言,“聪明的”被试是 0.71,“迟钝的”被试是 0.50(差异 p<O.02)。

在数学推理任务中,被试必须学会使用 3 种不同容量的广口瓶,以便准确地获得某种指定的水量。在关键的尝试中,用历时更长而又更惯常的程序得到正确的解决方法的人给予半分,用历时更短而又更新颖的程序得到正确的解决办法的人则给满分。主试预言会取得较好成绩的被试比预言会取得较差成绩的被试获得了更高的分数(p=0.08)。在预言取得较差成绩的被试中, 只有 40%的被试获得了新颖的解决方法,而在据说是成绩较好的被试中,88

%的人获得了一种或几种新颖的解决方法。被预言是聪明的被试所犯的差错亦只有被预言是迟钝的被试所犯差错的 57%。

总结上述所报道的研究似乎可以看出,被试完成理智任务的成绩至少有时可能无意地为主考的预言所决定。强调自我实现预言的无意的方面也许是合适的,因为在上述的几个实验中,主考和主试都在试图努力避免自己的预言影响被试的成绩。

动物行为

行为科学与生物医学有一种传统,即用动物作实验被试,即使最终兴趣所在的生物是人。这种用动物代替人的选择有时是因为使用动物更为便利, 有时却为实验程序的性质所决定,因为这种实验程序若不先在动物身上试验就用人作被试可能太危险。有时,还有一种积极的益处,即动物被试不太可能尝试猜测实验意图,从而不会尝试“有意促使”实验成功,或者甚至“故意破坏”这种意图的实现(Orne,1962)。所以,如果能够证明即使是动物被试的行为也可能是主试、训兽员或教师的期望或预言的结果,动物被试就构成了一种强有力的证据来源。巴甫洛夫(Pavlov)认为这是大有可能的。

不是所有知道巴甫洛夫这个名字的人都知道巴甫洛夫对拉马克1 的习得的性格特征的遗传学说感兴趣。事实上,他搜集了证据来证明变异的传递发生在白鼠学习能力的案例中。然而,在 1929 年的第 13 届国际生理学大会上, 巴甫洛夫做了非正式的说明:对他的实验所做的更严密的检查表明,白鼠的学习能力没有提高。这种检查所表明的是助理研究人员的教学能力提高了, 这位助理研究人员也许期望获得他似乎负有责任的学习能力的提高

(Gruenberg,1929)。

早在巴甫洛夫从事拉马克学说的实验之前,1904 年就有一个例子,涉及一匹以“聪明的汉斯”(Clever Hans)闻名的马的行为的自我实现预言

(Rosenthal,1965)。汉斯能用蹄击地做加减乘除运算。它能够拼、读和解决音乐和声问题以及回答私人问题。它的主人冯·奥斯滕(Von Osten)先生是德国的一位数学教师,他不像当时其他聪明动物的主人,没有凭借这匹马的才能去赢利,而且似乎不可能有任何行骗的意图。他很乐意让别人在他不在场时向汉斯提问,从而可以排除主人的暗示是汉斯具备这些能力的理由。在一系列十分出色的实验中,芬斯特(Pfungst,1911)发现,只有在提问者本人知道答案并且只有在汉斯用蹄击地以表示回答期间能看到提问者的情况下,它才能回答问题。最后,有人发现,无论人们何时向汉斯提问,他们都稍向前倾以便更好地看见汉斯的蹄。结果发现,那正是汉斯开始用蹄击地时未被人意识到的信号。然后,当汉斯接近表示正确答案的次数时,提问者通常会表现出很细微的头部运动。这种几乎觉察不到的暗示是要汉斯停止击地的信号,因而汉斯又做对了。提问者期望汉斯在正确答案的数目上停止击地, 这事实上是在“告诉”汉斯正确答案,从而实现他自己的预言。芬斯特在早期没有如此方便地获悉这方面的所有情况。经过一系列长期的、巧妙的实验之后,他才了解到汉斯成功的秘密。芬斯特很有说服力地总结了发现汉斯才能的困难。“从学生中寻找本该从教师中找到的东西。”芬斯特和其他人被这句话导向歧途太久了。