第一节 现代教育测量和评价的意义

  • 教育测量和评价的产生和发展简介
  1. 教育测量和评价的产生

教育测量和评价的产生与对学生学力和学业成就的检测活动的发展有着紧密的联系,其历史源远流长。早在我国的西周时期,就初步建立了学校教育制度,开始了教育测评。到公元 606 年,我国隋朝开始实行了科举制。国外学者也认为,中国古代的科举考试是教育测评的最初萌芽。但是由于种种原因,本世纪以来,我国的教育测量和评价的研究一直未能发展起来;而在西方,其中主要是在美国,自 19 世纪后半叶以来,教育测量和评价得到了迅速的发展。

19 世纪上半叶以前,学校考试一般都缺乏标准和应有的客观性,其基本方法是对学生逐个口试。随着学生人数的增多,这种考试很难继续实施了。1845 年,美国波士顿文法学校首先引入了书面考试。但这时学生成绩评定的

客观标准问题仍然未能得到解决。 1864 年,英国教师费舍尔( George Fisher)收集了许多学生的成绩样本,编制了第一本《量表集》,作为度量学生成绩的标准; 1897 年,美国的莱斯(J.M.Rice)博士发表了他对 20 个学校的 16000 名学生所作的拼字测验的结果;1905 年,第一个智力测验量表

——法国的《比纳-西蒙量表》发表。1916 年,美国斯坦福大学心理学教授特曼(L.M.Terman)发表了对比纳量表进行修订后的更完善的智力测验量表

——《斯坦福量表》,首次引入了智商的概念,使智力测量有了比较科学的计算方法,标志着心理测验已达到了比较成熟的阶段。

1904 年,美国心理学家桑代克(R.L.Thorndike)发表了《心理和社会

测量学导论》,介绍了心理统计方法和编制测验的基本原理; 1909 年,桑代克又编写了用于书法、拼字、作文、图画测验的标准测量工具,使教育测量开始走上了科学化的道路。因此,桑代克被称为教育测量学的鼻祖。1918 年以后,教育测量的使用范围逐渐从小学发展到中等以上学校,许多大学也开始设立了教育测量学课程。至本世纪 20 年代末,教育测量已发展到全盛期,教育测量在学力检测与教育成就的定量化、客观化、标准化方面取得了很大的成绩。

随着教育测量运动的发展,其弱点也逐步暴露出来。由于当时的测验都是围绕着教科书编制的,测验内容只要求学生记忆教材的知识内容,未能包括对学生的社会态度、兴趣、情感的检查,不能反映学生的全面发展和实际需要,因而它很快引起了人们的不满和批判。

1929 年,美国经历了一场严重的经济危机,教育的社会效果问题越来越多地受到人们的关注,这就直接推动了以教育的社会价值为依据的教育评价活动的发展。从 1934 年始到 1942 年止,美国俄亥俄州立大学教授泰勒

(R.W.Tyler)受卡内基基金会的资助,进行了历时 8 年的课程与评价研究, 这就是教育评价发展史上著名的“八年研究”。在对以往的课程和测验设计进行了尖锐批评的基础上,泰勒提出了一套以教育目标为核心的课程和测验编制原则,试图以此把社会的要求、学生的需要反映在课程与测验中。为了把这一思想与早期的测量区别开来,泰勒和他的同事正式提出了教育评价的概念:“在本质上,评价过程乃是一种测量课程和教学方案在多大程度上达到了教育目标的过程”;即认为教育评价就是衡量教育活动达到教育目标程

度的一种活动,测量是它的手段。根据泰勒的理论进行的评价活动能够获得关于目标完成情况的信息,有助于发现存在的问题,改进教育工作。所以, 这一理论受到了较为广泛的欢迎。

  1. 教育测量和评价的发展

泰勒等人的教育测量和评价观点以及相应的“目标评价模式”是教育测评历史上第一个比较完整的、影响较大的理论。自 30 年代以来的几十年中, 这一理论一直占据着主导地位。为了发展泰勒评价模式的实施技术,美国教育心理学家布卢姆(B.S. Bloom)等人提出了教育目标分类学理论,对完善教育评价理论起了重要作用。但随着测评实践和理论研究的发展,这一理论也逐渐暴露出一些根本性的缺陷。泰勒理论的核心是目标,但由于教育目标概念与教育结果的概念紧密相关,这就容易使人们将更多的注意力集中到对教育结果的评价上。因此,泰勒评价更多地被看作是一种对结果的总结性评价;然而,形成性评价可能有着更重要的作用。此外,人们还认识到,目标本身的合理性也需要评价,对那些预期目标以外的教育效果也不能排除在评价之外。

在对泰勒评价观进行分析和批判的基础上,又有人提出了新的教育评价观。克龙巴赫(L. J.Cronbach)修改了泰勒的评价定义,将评价定义为:“为作出关于教育方案的决策,收集和使用信息。”①他强调:“评价能完成的最大贡献是确定教程需要改进的方面。”②斯塔佛比姆(D .L.Stufflebeam)给评价的定义是:“为决策提供有用信息的过程。”③并强调:“评价最重要的意图不是为了证明(prove),而是为了改进(improve)。”④在这一观点的基础上,他提出了著名的 CIPP(Context-Input-Process-Product)模式, 即把对背景、输入、过程、结果四个方面的评价结合起来的一种评价模式⑤。受斯塔佛比姆等人的影响,美国教育评价标准委员会给评价的定义是:“评价是对某些现象的价值和优缺点的系统调查。”