三、标准化测验、考试的要素
(一)制定考试大纲或考试指导书
用以规定考试的范围、内容要求、方式及评分记分方法等。一般由专家、有经验的教师共同拟定,经教育主管部门批准。并须及早公布于众,使广大学生了解,向同一目标努力,也可作为平时教学参照。
(二)命题标准化
- 制定双向细目表和试题核检表 命题双向细目表是一种考查目标与考查内容的联列表。表中具体规定了各项考查目标与内容的比例(如比例可根据教学时数和重要性定)然后据此表命题。根据双向细目表编制成套试题后, 逐个检查,并制定试题核检表,从而考察试题核检表适切双向细目表的程度, 并加以调整,如适切程度较好,则考试内容效度越高。双向细目表中的考查目标与教学目标是一致的。应研究和制定生物学各个科目的教学目标,这样, 教师备课、上课按教学目标进行,命题、考试也按教学目标,那末就可将学生的学习结果与教学目标对照,从而考察学生所达到的程度与差距,正确评定学生的学业成绩,及学校的教学质量。我们在生理卫生循环系统标准化测验的研究工作中,制定了命题双向细目表,见表 18。
表 18 循环系统一章命题双向细目表
教学目标教学内容 |
识记 | 理解 |
应用 |
分析综合 |
总计 |
---|---|---|---|---|---|
血 液 |
7 |
5 |
11 |
23 |
|
血 管 |
5 |
2 |
7 | ||
心 脏 |
11 |
4 |
3 |
18 |
|
血液循环 |
4 |
10 |
5 |
24 |
43 |
淋巴循环 |
6 |
3 |
9 | ||
总 计 |
33 | 24 |
19 |
24 |
100 |
由于双向细目表是按教学大纲制定的,故按双向细目表命题,可使试题较科学、合理,因而可正确评定学生成绩,也能确保各项教学目标的完成。 2.题目数量要多,取样范围要大,覆盖面要广所谓客观性试题是指阅卷
时只有唯一答案,不需阅卷人主观判断的题。主观性试题是指阅卷时,需阅卷人主观判断的题。生物学试题中填空、改错、选择、填图、识图、遗传图解、计算等均可作为客观性试题,因答案可唯一,评分较为客观。根据我国国情和生物学科的特点,试题类型可以客观性试题为主,但主观性试题也应占一定比例,因论文式试题可考查学生的纵向、横向联系知识的综合能力及文字表达能力,但这类题不宜过于庞大,可分成若干小题,命题时要考虑阅卷时的评分误差尽量小。
3.必须经过广泛征题、审题、测试、建立题库、筛选、成卷等程序,编制出合乎要求的试卷(1)广泛征题:可有专门命题人员,或广泛征用试题。每题均可编一张卡片,正面写上题目,考查知识所属的学习水平,能力范围, 标准答案等。(2)审题:请专家审题。主要保证试题的科学性和所测的能力范围,及命题的技术性。然后确定该题录用、不用或修改。(3)试测:对初步入选的试题必须经过试测。试测是标准化考试的重要阶段,一个标准化考试有成千上万的考生,而且它本身又是一个选拔人才的决策过程,为了保证考试的信度与效度,必须要有试测阶段。试测要有代表性,参加试测的样本必须能够代表将来参加考试的总体,而且这些样本必须是经过有效的抽样办法取得的,人数不能太少。如全国生物学科的试题,可在一省或一地区统考试卷中插入 10 道试题。试测实施过程的情景,应力求与将来正式考试时的情况相近。试测还要具保密性,因为试测可提供试题的难度、区分度等信息,为建立题库作准备,因而要注意保密。为此,可提前若干年在不同地区分散试测。试测后对试题要进行统计分析,计算出每题的难度、区分度,在每张题卡的背面写上试测时间及统计的数据。对有问题的试题则删除。如有多次试测, 都应分别记入卡内。(4)建立题库。经过试测后、认为可用的题进入题库。题库的完善与否,在某种意义上是考试机构成熟程度的标志。(5)拼题合卷。根据试卷要求(测试目的及受试者的实际水平),从题库中提取试题,搭配成卷,试卷中需测量的知识、能力应与双向细目表里的比例相符,题目的数量也必须适合于所限定的时间。编制时要从易到难,合理安排,有一定梯度, 一般在试卷开头应该有一两个容易的试题,使考生解除紧张情绪,建立信心, 进入考试情景。
(三)评分记分标准化
评分方面,最好尽量使用微机阅卷,可减少误差。记分方面,应用标准分计算考生各科得分。但目前都用原始分计分,并以各科原始分数简单相加作为总分,进行排名次及录取。这样做是并不合理的,因为每个学科难度不同,每分值是不等的,现把它们等同起来对待而合成,就不一定能真正反映学生成绩在团体中所处的位置。如果用标准分并相加,才能比较。标准分又称 Z 分,是反映个人在团体中相对位置的最好的统计量。它是用标准差为单位来衡量某一分数与平均分之差的,如果某分数比平均分低一个标准差,其标准分为-1;如果某分数比平均分高 0.8 个标准差,其标准分数为 0.8。标
x − x
准分的计算公式为为Z = s 式中 x 为考生原始分, x 为该科平均分,s 为
该科标准差,0 为标准分的平均值。Z>0 则该生成绩高于全体考生平均分,Z
<0,则该生成绩低于全体考生的平均分。例:生物 84 分( x =53.5,s=13.3) 物理 73 分( x =50, s=9.84)
84 − 53.5
Z生 =
13.5
= 2.29
Z = 73 − 50 = 2.29
物 9.84
该生生物和物理成绩原始分不同,但因两门学科的平均分、标准差不同, 因而经计算后,标准分相同,说明该生的生物和物理处于团体的同一位置上, 而且该生的 Z 生和 Z 物均大于 0,故应高于全体考生生物、物理的平均分。并高于全体考生的 98%,仅低于 2%的考生。为什么可以得出这样的结论呢?因为知道了标准分 Z 分后,就可以通过查正态表求出该分数以下的数据个数占全部的比率。在正态表中所示的比率实际上就是正态曲线下相应的面积。图 4
—1 是正态曲线,横轴为标准分,0 为平均分,正态曲线中-3 至+3 之间大体上包括了全部考生的数据。如上例中该生的 Z 生和 Z 物均为 2.29 分,则可在正态表(表 18)中查到相应的 P=0.48899。P 表示 Z 与x 之间的面积,Z 分为正数,P=0.48899 应在平均数的左边,说明分数比该生低的应只有 0.02 即 2%
的考生,而该生分数高于全体考生的 98%。
表 19 正态曲线的面积(P)与纵线(y)(摘抄正态表中部分)
Z | y | P | Z | y | P |
---|---|---|---|---|---|
2.15 |
0.3955 |
0.48422 |
2.25 |
0.3174 |
0.48778 |
2.16 |
0.3871 |
0.48461 |
2.26 |
0.3103 |
0.48809 |
2.17 |
0.3788 |
0.48500 |
2.27 |
0.2965 |
0.48840 |
2.18 |
0.3706 |
0.48537 |
2.28 |
0.2965 |
0.48870 |
2.19 |
0.3626 |
0.48574 |
2.29 |
0.2898 |
0.48899 |
2.20 |
0.3547 |
0.48610 |
2.30 |
0.2833 |
0.48928 |
2.21 |
0.3470 |
0.48645 |
2.31 |
0.2768 |
0.48956 |
2.22 |
0.3394 |
0.48679 |
2.32 |
0.2705 |
0.48983 |
2.23 |
0.3319 |
0.48713 |
2.33 |
0.2643 |
0.48910 |
2.24 |
0.3246 |
0.48745 |
2.34 |
0.2582 |
0.49036 |
可把标准分转换成整数,即把 Z 分扩大 10 倍,加上 50。公式为
T=50 +
10(x − x)
s 如 上 例 可 转 换 成 T=50 +
10(84 − 53.5)
13.3
= 73
=50 +
10(73 − 50)
9.84 = 73
=73 此外,标准差 s,是应用非常广
泛的重要差异量数。计算公式如下:
S =
x 为原始分, x 为平均分,N 为总人数。
例:10 名学生的生物考试分数为 65,85,70,74,90,82,83,61,77, 78。求这 10 个分数的平均数、标准差。
解:
x =
S = = 8.41
综上所述,用原始分记分,既不能看出该生水平的高低,也不能确定他哪门学科学得更好。转换成标准分后,同一学科中不同考生能比较,同一考生的不同学科也能比较。能清楚地表明考生得分在团体中的具体位置,即是处于平均水平,还是在其上,或其下。以及考生各科在不同科目中所处位置的高低,这比传统的衡量区分考生要优越得多。在高考中,还可为录取单位根据考生总成绩,参考相关科目的成绩位置,择优录取,提供了客观可靠的依据。
(四)提供解释原始分数用的各种常模和试卷复本
常模是个人之间比较时的一个标准参照点,其功能主要是能比较个人在团体中的位置,用来作为比较用的参考团体叫常模团体,描述常模团体的统计量(如平均数、标准差等)叫常模资料,简称常模。我们平时各学校自己命题考试,结果是不能互相比较的,如果是全区统考,则全区统考的平均分就相应于一个常模。各个学校之间比较或者确定某一学校成绩在全区的相对位置,都要用到常模。
标准化考试试卷需要有复本,试卷的复本必须与试卷等值,有时还可有多份复本。等值是指测量的是同一种心理特性,具有相同的形式,题目数量相等,并有相同的难度,内容范围相同,但具体试题不应重复。
(五)考试实施过程必须统一,答题步骤和给分标准必须严格规定标准化考试所需阶段的流程图如下: