终结性评价的方式

比起诊断性评价和形成性评价来,对终结性评价的探讨更多一些。另外, 许多教师提起评价,所指的无非是学期(学年)结束时的终结性评价。

为了发展学生的个性应当有怎样的评价,是非常重要的问题。围绕着相对评价还是绝对评价的问题,一直争论不休。不过,从当今的势头看,从相对评价向绝对评价过渡的倾向是主流。相对评价的问题在于,通过学生的等级化而加剧了甄别的弊害。从集体中的得分分布,依据一定的比率将学生排出等级,就是相对评价的步骤。这种评价将会使分数竞争的氛围支配学校, 从而轻视了人的教育的其他方面。基于这点,人们逐渐从相对评价转向绝对评价。在绝对评价中,学生的水平是教师对照教学目标查定的。这个过程是教育评价的本来面貌,是理想的评价步骤。然而,学生对这种绝对评价的反应,未必令人满意。

在初高中,完全实施绝对评价的学校尚不多见。这是由于,尽管认识到绝对评价是理想的,但要考虑到学生和家长的反应。因为,当今的学校为应试体制所困扰,在集体中的相对地位最受重视,人们需要有这种反馈信息。每个教师的目标基准未必是稳定的,即使达到了教师预定的目标水准,但能否通过升学考试这一关,仍然是心中无数的。大多数学生和家长就是这种心态。绝对评价及评价法的改革之所以遭到冷落,不是由于评价自身的问题, 而是由于以高考为顶点的应试教育体制所使然。

有别于相对评价抑或绝对评价的另一个问题就是改进评价法的一种尝试。其出发点是:通过这些改进,以便更准确地把握每个学生的能力和能力倾向,并使所有学生主动积极地学习。

改革之一是,按照不同视点作出评价。

阶段评分是一种量的尺度,例如,“4”这一得分,并不表明哪些部分优异,哪些部分低劣。换言之,一门学科的学力也是拥有多种侧面的,必须多角度地加以评价。例如算术成绩是“4”分,它不能表示运算技能、问题解决力等等的哪一方面孰优孰劣,这样就无法准确地评价个性。从这一反思出发, 出现了新的动向:将量的、片面的评价改变为质的、多角度的评价。最具体的表现,就是“学校家长联系手册”的改革。许多人主张引进“分不同视点作出评价”的方法,所谓“分不同视点作评价”,就是各门学科设若干视点, 再分视点评定学习的到达度。在语文学科中“说”、“读”、“写”视点的设定,这些都是表现语言学力的各个侧面,都是很重要的学力。当然,这些学力因素是彼此相关的。从知识、技能一类的基础学力因素,到应用力、态度之类的发展性学力因素,构成一个层级。因此,虽说是分视点评价,也不

是彼此独立进行的。知识、技能优者,应用力、态度亦优,这一评价倾向也会发生。但是,仔细调查一下各个学生的能力就可以发现,每个学生各有个性,诸如“知识”扎实地掌握了,但“应用力”薄弱这一“个人内差”。由此看来,分视点作评价是可能的,并可以作出更详尽的反馈。

不过,即使分视点作评价,仅仅执着于绝对评价的立场,也会派生出如前所述的问题。因此有必要从个人内差相对评价的立场出发进行分视点的评价。例如,某学科的评价视点设知识、技能、理解、应用力、态度,分别评定目标到达度,则一定会出现所有的这五个视点均获得优良评价的学生,或者反之,全为不良评价的学生。为了避免这一局面,可以考虑相对评价的方法,即评价一名学生相对优异之处和相对低劣之处。

一般说来,分视点评价是个人内差评价,像上述的分视点评价,可以说是个人内差相对评价。通常所说的相对评价,可以视为与此相对的个人内差相对评价。由于在个人身上各有优势、劣势,任何一个学生均可作出优点与劣点的评价。这样,即使是差生也不会由于评价而造成强烈的失望感。

改革之二,努力度或进步量的评价。

其着眼点是,由于努力的成果不能反映在评价之中,学生容易丧失学习动机。就这一点,不能说相对评价是理想的评价。而绝对评价,是学习的到达水平本身得到评价,不是同集体内的其他成员比较而得出的相对地位,所以个人努力的成果不能正确地反映在评价之中。例如,测验得分是绝对评价的一个指标。若测验的难易度相等,努力的成果会如实地反映在得分上。在语文测验中仅得 60 分的学生,通过努力学习,考了 70 分,这增加的 10 分, 就反映了这种努力度。从测验得分换算成等级评价分的场合也是同样情形。若从“3”级上升到“4”级,就可以视为努力的成果。不过,同测验得分相比,由于等级分是一个大致的指标,不能敏感地反映出努力度。

由此看来,绝对评价是合理地评价学生努力度的一种方法。倘若努力度得到正确评价,学生的学习积极性就会提高。不过,事实上,仅仅靠绝对评价获得的信息是不能满足的,还有求取相对评价所获信息的倾向。例如,仅仅了解到在某测验中得了 70 分这一信息还不够,还想知道考了第几名。名次是表示在集体中所处地位的东西,是相对评价的一个指标。而一旦加上了相对评价所获的信息,又会出现埋怨努力度未能正确评价的学生。

于是,国外近年来在“学校家长联系手册”的改革中,绝对评价的指标不明记,只记录进步的程度。例如,同上学期的成绩相比是否进步了。在手册上记录“有进步”、“一般”、“努力不够”一类的评语。这是将进步程度分三等级加以评价的,也有人尝试用“○”和“△”的符号作出等级评定。不管哪一种情形,由于能够如实地评价努力度,可以期待将会对学生产生良好的影响。

但是,国外一些小学尝试这种努力度评价后,也发生了如下预想不到的怪现象:到了高年级之后,学生知道了上述努力度评价的谋略,因此在第一学期不好好用功,测验成绩平平,到了二三学期,再逐步提高成绩,以获取努力度提高的评价。这是谁都会发现的方略。如果年年进行这种努力度评价, 会有越来越多的学生采用这一方略。

上面所述的仅仅是把评价限于量的尺度来进行的,不能说是学生喜欢的评价。因此,经历了这些评价方法的改进之后,最近倾向于采用“到达度评价”。历来的评价是从能力主义出发的,具有划分等级的功能。基于这一反

思,到达度评价受到广泛的支持。依据得分将学生排队,判定是否到达了目标,要不要再作辅导,这就是到达度评价的特征。确实,这种评价信息对于教师、学生都是必要的,这种信息有助于调节教学活动。

不过,布卢姆已经阐明,这种到达度评价的信息在教学过程中尤为必要, 应当作为形成性评价作出反馈。但要在终结性评价中贯彻这一想法,实际上会碰到种种困难。同形成性评价不同,在终结性评价中必须评价范围极广的学习内容。但测验的项目不可能涵盖所有这些内容,只能选择有代表性的, 因此,测验项目能否正确地同学习内容相对应,是一个问题。

在学习内容具有系统性、所测项目确凿地反映学习进度的场合,评价到达度是简单的。亦即掌握的内容如实地同进度或到达度对应。但在社会科和理科一类的学科中,内容不能作为一个系统来排列。同样的内容可以这样组织也可以那样组织。在这种场合,掌握了哪些内容并不能表明进度或到达度。倘若要用完满的形式表示,就得准备大量的测验项目。

由此可见,到达度终究还是依据多少百分比的正答率来分等级地评价的,而且这种正答率是依测验题的编制方式(难易度)而变化的,这样就同旧时的绝对评价无多大差别了。所不同的只是在分析学习内容之后,选定与学习内容相应的测验项目。当然,进行评价的目的和评价者的心态也有不同。这些改进受到高度评价,但在具体的技术性问题上尚待进一步改进。

综上所述,尽管已经出现了形形色色的评价论,但至今没有哪一个扎根于今日的学校。仅仅有诊断性评价和形成性评价是不够的,实施终结性评价也是不可避免的。这种终结性评价不仅应当作为师生关系的应有模式,而且应作为家长及其背景性因素的社会关系的理想模式来追求。