二、历史学业评价的基本模式

一般说,中学历史学科的学业评价应当包括形成性评价、诊断性评价和终结性评价三种基本模式。

  1. 形成性评价。

形成性评价是在教和学的过程中使用的系统性评价,用以随时对其中任何一个过程加以改进,从而达到提高教学质量的目的。形成性评价的基本特征是将一个较长的教学过程看成为由一系列连续的小教学单元所组成的整体,在关键的教学单元(甚至每一个教学单元)完成后,对学生的掌握情况进行适时的评价。评价的方法以单元测验为主,面向全体学生。其具体形式比较灵活,可以是课堂练习,也可以是专门设计的小测验,时间长短则视评价目标的多少而定。形成性评价的基本功能是:向全体学生呈现其短期学习成果,强化正确的学习行为,纠正不正确的学习行为,调整学习策略;向教师报告其短期教学效果,为教师调整教学进程、改进教学方法、转移教学重

点和总结教学经验提供建议;为全面的学业评价积累过程性依据;向有关方面报告教学进度和状况;为课程、目标和教材的编制者提供具体的改进建议。

教师应当分析整个教学序列可以分成几个相对完整的教学单元,它们之间有怎样的联系。以现行的教材编写体系为例,史实知识基本上是按时间为经、事件为纬的直线排列,并由篇、章、节、目组成。因此,一个单元可以是一目、一节、一章或一篇。从史论知识和史法知识的角度看,则是一种并列综合排列,往往在一章中,甚至在一节、一目中同时出现许多概念;有些史法知识,如评价历史人物的方法、分析主客观条件的方法、概括特征的方法等,一般需要经过较多单元的学习才能真正掌握。

一般情况下,我们根据史实知识来划分单元,即以章为单元,有时也以节为单元。这种划分的基本要求是:①史实知识为基础,尽可能地保持教学和评价上的完整性,抓住关键的学习单元重点评价;②在上述要求的前提下,根据实际教学情况,使划分尽可能地“小步子”,采用多种形式灵活实施评价,以便每次评价的内容相对少一些,反馈更及时一些,所花时间短一些,纠正幅度也小一些。

评分工作最好先在教师的指导下,由学生互相交换、当堂自评,然后由教师抽样检查。这样做,一则可以调动学生的内在积极性,广泛开展自我评价;二则可以起到当场强化的作用;三则可以减轻教师的批阅负担。

形成性评价需要注意的是,测验决不能使学生有任何评定等级的联想。只有这样,学生才可能将形成性评价看作是对学习的帮助,从而采取积极主动的合作态度。有些历史教师曾试验将形成性测验的编制改革为在教师的指导下,逐步由学生自编,取得了非常好的效果。

  1. 诊断性评价。

诊断性评价是根据初步掌握的学习情况,进一步探究和确定教学双方的问题,从而通过适当的措施使教和学在各方面得到最佳结合的评价。

诊断性评价强调的是对问题的针对性以及诊断的清晰程度。进行多次形成性评价以后,可能会发现全体学生对某一类目标掌握得比较好,而对另一类目标始终较差;也可能会发现有一部分学生一直处于较高水平,而另一部分学生始终处于较低水平。此时,就需要进行诊断性评价,以帮助我们进一步认识其中的原因。

在大多数情况下,诊断性评价面向少数学习不良的学生,但有时也用来寻找大部分学生中存在的问题根源,或者了解处在高水平学习位置的学生的学习经验等等。

影响学习的因素除了认知方面以外,还有非认知方面。因此,诊断性评价所用的测量手段也是多方面的。如能力测验、学习倾向测验、智力测验、人格测验、态度测验等。另外,还可以采用家访、座谈、聊天、提问、练习等和谐的、不易被察觉的方式来进行测验,这样往往更容易了解得深入、具

体。

诊断性评价一般以单项内容为主,有时采用多项内容,很少是综合内容。项目越多,问题越不容易清晰,原因也越不容易找到。

诊断性评价有助于教师更精确、更具体地贯彻因材施教的原则,认识教学中的深层次问题;有助于学生更深刻地了解自己,认清自己的短处或长处,迅速捕捉主攻目标;有助于其他同教学有关的人员恰如其分地帮助和指导教学;可以为教学目标、教材编制者提供更为具体的改进依据;为全面的学业评价增加更为生动的过程性资料;有利于对教学实验的深入研究。

问题的提出主要依据于形成性测验和评价,但并非所有的问题都需要进行诊断性评价。一般而言,能成为诊断对象的问题至少具有如下特征中的一个:

(1)典型的问题。该问题在相当的学生中存在,并表现出一定的集中性。(2)长期的问题。该问题在连续几个形成性评价中都有所表现,在正常

的教学中出现持续的误差。

  1. 异常的问题。该问题在前几届学生中都没出现,在现时的教学中却明显存在,但又找不出很有说服力的逻辑解释。

  2. 特定的问题。这和特定的实验方案有关。如需要对某个变量实行控制,以便比较实验结果;又如某种新教学方案的实施,要了解实施后的变化情况。

进行诊断性评价除了需要较高的专业知识、丰富的实践经验和测验编制技巧外,还必须具备如下条件,才能取得较大的成功:①师生之间要有一个良好的和谐民主的关系;②应当使学生确信之所以要诊断,是为了一起来帮助改进教学和学习;③如果是教学方面的问题,应立即在以后的教学中加以改进;④个别学生的问题应个别地解释,并提出建议。

  1. 终结性评价。

终结性评价是系统的教学过程结束之后,对学生的学习结果实施的评价,其首要任务是给学生评定等级,或是评定某教学方案、方法在整体上的有效程度。它的基本依据是系统教学目标,要分析和评价学生的学业是否已按计划达标,达标程度如何,在某种程度上还要有助于教师了解学生在完成这一系统目标学习后,相对于以后的学习或进行某种工作的最低水平限度的距离。因此,终结性评价也可称为系统目标评价。系统目标可以是一学期、一学年的目标,也可以是初中阶段或高中阶段的目标。通常的期终测验、毕业考试或会考均属于终结性评价。

终结性评价的基本功能是评定学生的学业等级;向学生展示其最终学习成果,并提出其今后的学习方向;为全面改进教学提供依据;向目标、教材、课程的编制者提供系统改革的总体建议;向有关方面报告学习结果。

系统教学目标是不可能全部列入测验目标的,终结性评价的测验目标只能是系统教学目标的一组样本。如何使测验目标能更好地反映和代表系统教

学目标,是终结性评价测验的关键。通常,历史测验目标应符合下列标准中的几条或一条:①在史学上被认为是最重要的要素;②在系统教学目标中被认为是中心环节或概括性、代表性最大的要素;③在今后的学习或工作中被认为是最基本的要素;④在测量上被认为是可以提高测验性能的要素;⑤在学业评价上被认为是可以增加反馈信息及其清晰度的要素。

终结性评价的测验一般采用百分制。如何给学生的分数评定等级,是个值得研究的问题。目前主要有以下几种做法:

  1. 按常态曲线中的百分比决定各等级的人数。如 A 等占 10%,B 等占20%,C 等占 40%,D 等占 20%,E 等占 10%。

  2. 按经验和历届学生的情况决定本届学生的等级比例。加 A 等占 5%, B 等占 20%,C 等占 40%,D 等占 30%,E 等占 5%。

上述两种做法的共同问题是使等级评定标准缺乏稳定性,这种做法在事实上使终结性评价“水涨船高”,失去了其评价学生达标程度的功能。

  1. 在编制试卷时就将试卷在实际上分成不同等级的阶梯,学生能完成到哪一个阶梯的项目,就意味着达到哪一等级。这种做法对命题的要求甚高,国内还不多见。

  2. 按约定俗成的做法,以 60 分为合格线,90—100 分为 A 等, 80— 89 分为 B 等, 70—79 分为 C 等, 60—69 分为 D 等。