二、学生学习质量的评价

我们知道,测验并不是教学的最终目的,它只是一种手段。通过测验, 我们希望得到尽可能多的教学反馈信息,以指导我们今后的教学工作。对测验成绩进行科学的整理和归纳,是我们获取教学反馈信息的重要途径。

  1. 测验分数的科学解释。

教育统计学理论指出:仅从孤立的观点来考查测验的原始分数(即直接从试卷获得未经过任何处理的分数),那是没有什么意义的。因为它无法反映某个分数在特定测验群体中的位置,而且有时常常会给人以一种错觉。例如,似乎一个得 40 分的学生其掌握知识的程度仅是得 80 分学生的一半,或者说一个学生在某次测验中的成绩为零分,则由此可以推断出该学生没有学到任何知识。上述看法显然是错误的。因为在我们现行的测验中,其测验的原始分数并不具备有“得零分者必定完全不具备有任何知识” 的特性。此外,由于每次测验的性质、要求等条件的不同,也导致不同测验之间的原始分数并不具有可比性。因此,为使我们能从测验分数中得到更多有价值的教学反馈信息,必须对测验的原始分数进行科学的分析和解释。

对测验分数进行科学的分析和解释的指导思想是:考查一个分数的价

值必须建立在与参照群体相比较的基础上。也就是说必须与考查这个分数在特定群体中的地位紧密联系起来。基于这一指导思想,要对测验分数作出评价,必须首先找出能反映特定测验群体主要特征的一组参量,并以此为参照点来对测验分数的价值作出科学的评价。

通常人们把特定群体中的最高分、最低分和平均分作为三个基本参照点,以此作为粗略考查测验分数在特定群体中所处地位的优劣标准。在此基础上,如果测验结果满足正态分布,则可进一步从正态分布曲线中,得到更多的有价值的教学反馈信息。

用寻找参照点的方法虽能较好地反映测验分数所具有的统计价值,但它并不能对各种测验的分数进行直接比较。这主要是由于不同测验其测验分数的性质不同,以及测量单位的不同而造成的。为使测验分数既能反映在群体中的优劣程度,又能对不同测验的分数直接进行比较,人们引入了标准分数(Z)的概念。

所谓标准分数,就是对原始分数进行标准化处理和转化的分数,其转化公式为:

Z = (X − X)/δ

式中X为原始分数,X为原始分数的平均值;δ为测验的标准差。

上式中,X - X的绝对值反映的是原始分数偏离平均数的大小,X - X 的正负号反映的是原始分数偏离平均分数的方向。当 Z 为正值时,表示这个成绩在平均成绩之上;反之当 Z 为负值时,说明这个成绩在平均成绩之下。公式X - X与标准差δ的比值反映的是原始分数偏离平均分数的程度。

由此不难看出,经过上述转化的标准分可以直观地测量出这个学生在某次测验中在其群体中的相对位置。

由于经标准化转化的 Z 分数具有平均数为零、标准差为 1 的共同特征, 因此它具有可比性,即可以用它来直接比较同一考生在不同科目测验中的学习成绩。

  1. 从频数分布图看学生的学业质量。

图 7—2 是根据 1987 年上海市高中物理统考抽样样本成绩制作的频数分布图,从分布曲线可知,它呈负偏态分布, X>60,且满足X<Md < M0,这说明大多数考生的成绩都在 60 分以上。由于这次统考具有较好的内

容效度,因此若以传统的 60 分作为判断学生学业成绩是否合格的标准,那么从分布曲线可知,考生中的大多数都已基本达到教学大纲所规定的要求,从分布曲线中我们还可粗略估计学生成绩的两极分化程度。

一般来说,对学业水平的测验要求频数分布曲线呈负偏态分布,对学习能力的测验,则要求频数分布呈正偏态分布。

  1. 从集中量和差异量看学生的学业质量。

频数分布图给予我们的信息虽直观,却非常粗略,为了进一步考察学生学业质量所达到的程度,需对集中量和差异量进行统计解释,从中获得更为确切的教学反馈信息。

表 7—9 是以参加 1987 年上海市高中物理统考的各类考生为样本的集中量和差异量统计一览表。从表中数据可以看到,考生成绩的集中量参数

依市重点中学、区县重点中学和一般中学的秩序逐渐递减,差异量参数依同样秩序逐渐递增。这说明,三类学校的总体学业水平和学习质量稳定性方面存在一定的差异,其总的趋势是:市重点优于区县重点,区县重点优于一般中学。

表 7—9

集差量

学校类别

中位数

平均数

全距

标准差

市重点中学

90.00

88.05

44

9.15

区县重点中学

85.00

82.58

66

11.92

一般中学

68.00

66.35

91

17.44

集中量和差异量的统计分析,不仅可以用来比较不同类型考生之间学业上的差异,而且可以对特定测验对象的学业质量作出评价。一般来说, 如果某次测验具有较高的内容效度和信度,那么从集中量我们可以推断出学生对测验内容掌握到何种程度,从差异量可以了解到学生学业上的差异。

如果将集中量和差异量的统计分析应用于每一试题,那么,由于每一试题都与一定的知识量相对应,因而从这些统计量中我们可以更深入地了解到学生对各个知识点的学习状况。例如,从某题得分的平均值,我们可以推知学生是否基本掌握了该知识内容,同样,从该题得的全距和标准差, 即可了解学生在学习上的差异。

  1. 学生学习能力的评价。

由于美国著名心理学家布鲁姆的认知领域中的学习目标分类学能比较好地把知识和能力有机地结合成一个整体,使传统测验中的得分与知识的对应关系,扩展到得分与能力的对应关系,这就为我们获得更高层次的教学反馈信息——学生学习能力的反馈信息奠定了基础。

首先根据命题的双向细目表,将试题按学习目标分类,然后计算出全体学生在各类认知层次中的得分率,这样便可得到全体学生能力统计表。通过将全体学生的各项得分按学习目标的分类进行再统计,这样就将

全体学生的各项得分与不同层次的学习能力一一相对应,从而反映出全体学生能力分布的概貌。若以大于等于 0.6 的得分率作为具有该能力水平的判断标准,则从能力统计表中,很容易知晓全体学生学习能力达标的概况。

表 7—10

得分率 分类

学校类别

识记

理解

应用

分析综合

市重点中学

0.98 0.93 0.88

0.73

区县重点中学

0.93 0.88 0.82

0.64

一般中学

0.83 0.76 0.65

0.43

表 7—10 是 1987 年上海市高中物理统考的能力统计表,从表中数据可以看到,不论哪类学校,随着考核能力水平的提高,其得分率均呈下降趋势。若以大于等于 0.6 的得分率作为判断具有该能力水平的标准,从抽样试卷来看,参加统考学生的总体能力达到应用级,其中市重点中学和区县

重点中学达到综合分析级,一般中学只达到应用级。进一步观察表中数据可以看出,在相应能力层次上,市重点中学、区县重点中学以及一般中学的得分率存在有较大的差异。这说明,1987 年物理统考能比较好地区分出三类学校考生在能力上的差异。

如果将上述统计方法运用于对每个学生的各项得分按学习目标的分类进行再统计,即可得到每个学生学习能力统计表。同样,若以大于等于 0.6 的得分率作为判断具有该能力水平的标准,则从能力统计表中可知晓每个学生学习能力的概况,它为在教学中因材施教提供了具有一定参考价值的教学反馈信息。