一、学生学业成就评价的主要方法
- 测验法
测验法是检测学生学习成果的主要方法。“测验是对一个行为样本进行测量的系统程序。”①“所谓‘系统程序’是指测验在编制、实施和评分等方面都是依据一定的规则确定的;测验的题目依据测验的目的经过系统地选择;测验实施的方法和评分按事先确定的规则进行。这样就控制了无关变量, 使所有的学生都能在同样的条件下接受测验,测验的结果也得以在学生之间进行比较。所谓‘行为样本’中的行为是指学生对测验题目所进行的反应。人们根据这种反应去推断所要测量的东西。”②
苏联学者 B·Л·别斯帕利科教授认为,学生对学习材料的掌握都是按“掌握水平”③逐级推进的,所以每一级水平的考察,都可借助于与其完全相符的测试题来进行一次性测验,所测结果为学生对学习材料的某一级“掌握水平”的掌握系数(Kα)。
K = α 。
α P
式中 P 为对受试者所提出的题目总数,a 为受试者正确完成的题目数量。如果测验题是问答题题型,上述公式改为
e Kα = L
式中 L 为对受试者所提出的题目满分值,e 为受试者完成题目的得分值。“如果掌握系数 Kα达到 0.7 或者 0.7 以上,那么就可以认为学生在该级
掌握水平(a)上对知识和能力的掌握是成功的”,①从而也能说明这堂课的教学是成功的。
虽然,地理教学目标的分类和层次与上述的“掌握水平”不同,但这种与教学目标相联系的测验方法是适用于学生地理学习的评价。
- 教学进程中的测验
测验贯穿于地理教学的全过程。由于测验在不同的教学阶段中所起的作用不同,一般可以将其分为诊断性测验、形成性测验和总结性测验三种。
- 诊断性测验诊断性测验一般是指在学期、学年开始,或一门课程、一个单元课程教学开始之前进行的测验,其目的在于了解学生对即将学习的新的教学内容具有的准备状况。
由于诊断性测验的目的不同,一般可分为前提条件测验和事前测验。前者目的在诊断学生是否掌握了本单元或本课时学习所直接需要的基础知识、技能和智力,所以也叫准备测验;后者的目的在于发现学生对新设计的教学方案中的哪些内容已经掌握了,或者部分地有所了解,从而修改教学方案, 所以这种测验也叫摸底测验。
- 形成性测验形成性测验是在教学方案实施过程中进行的测验。其目的在于了解学生在哪些方面有较大的进步?哪些方面还需要帮助?哪些学生学习有困难,需要进一步帮助?进而使教师调整教学计划,改进教学方法。
① ② 李玉芝:《评价学业成就的方法》,光明日报出版社,1987 年。
③ 注:他将教学目标分成由低到高的四级“掌握水平”。
① 鹿志保:“课堂教学效果的评价方法及对传统课堂教学的分析”《外国教育动态》1987 年第一期。
在新的教学评价体系中,形成性评价具有重要意义,它特别强调现代教学评价应使用测验的结果来诊断和改进教学,帮助每个学生在学业上取得成功。
- 总结性测验总结性测验是在一个大单元或一个阶段的教学计划完成之后进行的测验。其目的在于了解学生是否达到教学目标,为制定新的教学目标提供依据。这种测验与形成性测验所不同的是,它是总括各小单元, 以大单元教学目标为总体范围,测定经过几周的单元教学后所学到的并且巩固了的知识、技能;在了解哪些学生已熟练掌握教学内容的同时,确定每一个学生的成绩等级。
- 良好测验的基本条件
运用上述这种课堂效果评价方法的关键,在于编制出一套与某级“掌握水平”完全相符的标准测试题。因为只有良好的测验工具才能帮助教师正确评价学生的学业成就,促进学与教的良性发展。而不良的测验不仅达不到评价的目的,还可能歪曲学生的成绩,造成教学上的失误。所以地理教师自编测验题,还是使用他人编制的测验题,都必须考虑测验表 10-1 地理课堂教
评价指标 |
评价等级 |
评分 |
总体评价定性描 述 |
|||||
---|---|---|---|---|---|---|---|---|
序号 |
名称 |
指标要素 |
优 |
良 |
一般 |
较差 |
小计 | |
1 |
教学目的内容 |
明确度 |
6 |
5 |
3 |
2 |
||
适切度 |
6 |
5 |
4 |
2 |
||||
科学性 |
8 |
6 |
4 |
2 |
||||
教育性 |
6 |
5 |
4 |
3 |
||||
合理性 |
8 |
7 |
5 |
3 |
||||
2 |
教学过程方法 |
针对性 |
8 |
6 |
5 |
3 |
||
恰当性 |
8 |
7 |
5 |
3 |
||||
启发性 |
8 |
6 |
5 |
3 |
||||
3 |
教师基本素养 |
教学组织 |
7 |
5 |
4 |
2 |
||
教学民主 |
5 |
4 |
2 |
1 |
||||
教学语言 |
6 |
4 |
3 |
2 |
||||
演示板书 |
4 |
3 |
2 |
1 |
||||
4 |
教学即时效果 |
双基能力 |
12 |
10 |
8 |
4 |
总体印象调整分 (±5) |
|
情意发展 |
8 |
7 |
6 |
4 |
||||
定量评价四项指标总分 |
||||||||
教学特长特色 |
在教学方面具有特长,或形成特色者另行酌情加分,加分从严掌握,一般控制在 1—5 分 |
特 长特 色 加分 |
||||||
总体评价总分 |
||||||||
总体评价等第 |
学校: 年级和班级 教学时间: 年 月 日 午 节
学评价表(中学适用)
指标要素优等参照标准 教学目的明确;教学要求具体
符合大纲要求;切合学生实际,教学要求适度,教学密度容量适当
教学内容正确;地图、地理图表、地理教具选择合理;讲授准确适当 结合教学内容加强爱国主义、国际主义、辩证唯物主义教育,树立正确的人 口观、环境观、资源观,培养良好的道德情操,个性品质、学习习惯和方法
等
整体设计合理;图文配合得当;突出重点;抓住关键;突破难点
因材施教,分类指导;教学反馈及时、随时调控教学;指导学法 优化教学形式、方法、手段,使其符合学科特点、教学内容和学生实际的需
要
创设情景;精巧设问;培养正确的地理思想方法 教学准备完备;教学环节紧凑;教学节奏适度;具有应变能力;课堂纪律良
好
教态亲切自然;培养学生学习主动性、自信心;鼓励学生勇于提问讨论
表达完整;条理清楚;准确生动;讲普通话;地理语言规范
演示操作熟练、规范;板书图表设计合理;字迹清楚、工整、规范
按时完成教学任务;双基落实;能力得到培养 学生主动参与;思维活跃、反应面广;师生共鸣
(1)评价时将有关教学状况与评价指标要素的优等参照标准逐项对照衡量后,在评价等级分值栏内打“√”。(2) “评分”栏内的“小计”是指某一项指标的几个要素评分
使 之和。“定量评价四项指标总分”指 1—4 项指标“小计” 用 分之和(3)“总体印象调整分”是在“定量评价指标总说 分”的基础上,根据总体评价的印象进行调整。一般在± 明 5 分的幅度内进行调整。(4)“总体评价总分”是指“定
量评价四项指标总分”与“特色特长加分”、“总体印象调整分”之和。(5)总体评价等第分为优、良、一般、较差四等。优等为 90—100 分,良等为 75—89 分,一般为
60—74 分,较差为 59 分以下
执教者: 职称: 评价人: 是否具备良好测验的基本条件, 即是否符合效度、信度、难度、区分度四个基本条件。
- 效度效度是指一项测验所能确实地测量到它所要测量的结果的程度。一项测验效度越高,测量出的正确性就越高,如果一项测验没有效度, 那么这项测验就告失败。测验的效度具有相对性,对一级水平目标有效的测验,对其他级别目标不一定有效,或者完全无效;对学生地理认识水平的有效测验,不一定能有效测验学生地理的动作技能水平。
在几种效度类型中,内容效度对测验学生的学习结果是最主要的种类。内容效度是指一项测验的试题取样是否充分概括了所要测量的全部内容,也就是测试题的内容代表性如何。如果测试题内容符合教学目标,切合教材内容,含盖面广,代表性强,其测验结果必定是正确的,即测验有效,否则反之。
在实际教学中,提高试题内容效度的有效方法是:分别列出教材内容的各项重点和所要测量的各类学习结果,并以相对的重要性来加权,最后编制成命题双向细目表。
-
信度信度是指一项测验多次应用所得结果前后一致的程度。它反映了某一测验测试结果的稳定可靠的程度,是良好测验必不可少的条件,但也不是唯一的条件。因为信度高的测验不一定效度也高,如一项测题多次施测结果基本相同,说明它的信度很高,但它反映出来的所测内容,每次仅达应测内容的百分之三十左右,则说明它的效度很低,这种测验意义就不大。所以,信度须与效度相结合,教师在编制或选择测试题时,须在确保其效度的前提下,考虑其信度。
-
难度难度是指测试题项目的难易程度。它具有很大的相对性,同一项目对学生甲是难题,对学生乙却可能是易题。在考察学生对知识、技能的掌握水平时,测题只要是符合“掌握水平”级别要求,即便是难到通过率很低,或是易到通过率很高,都必须被保留,只有这样,才能真正衡量出学生的掌握水平。
-
区分度区分度是指测题对于学生实际水平的区分程度和鉴别能力。区分度高就意味着测题对于实际水平高和实际水平低的学生,有较好的区分和鉴别能力,即实际水平高的学生得高分,实际水平低的学生得低分。反之, 则表明测题对实际水平高低不同的学生的区分和鉴别能力差,即实际水平高的学生得低分,实际水平低的学生得高分,或者得分差不多。