一、化学测验的信度和效度

  1. 信度

信度是指测验的可靠性和稳定性程度。通俗地说,测验的信度是指该测验对同一组考生实施两次或多次,所得结果的一致性程度。一致性程度越高,说明测验的信度就越高。信度的大小用信度系数来表示。

  1. 信度系数的求法

在统计学中估计事物或现象之间数量变动的一致性,主要采用相关分析的方法,即求出两列变量的相关系数 r。对化学测验而言,前后两次测验结果(得分)的 r 大,则信度高,反之,r 小则信度低。

相关系数的计算常用皮尔逊积差法,如一一对应的两列变量分别记为X、Y,N 是变量的个数(N≥30),则

r =

具体计算时也可借助计算器(如 fx-180P)进行。

计算信度的方法有重测法、复份法、分半法和 a 系数法等。重测法的模式是:

一、化学测验的信度和效度 - 图1测验 A1 测验 A2,信度系数 r12

两次测验内容完全相同,时距△t 应恰当。太短,第一次测验记忆犹新, 夸大了稳定性;太长,考生知识、能力的发展使第二次测验与第一次测验表现出大的差异,导致稳定性降低。

复份法的模式是:

一、化学测验的信度和效度 - 图2测验 A 测验 B,信度系数 rAB

A、B 是两份等值(题型、题数、难度、区分度相等)的测验,俗称“AB 卷”。在较短的时间间隔内,对同一批考生测试 A 后继而测试 B。如果时间允许,甚至可以在一次测验中先后施行测验 A 和 B。

分半法的模式是:先人为地将一个测验分为等值的两半(如奇偶分半、交叉分半等),求出同一批考生在这两半题目上得分的相关系数 rhh,再校正至整卷的信度 rx x:

rx x

= 2rhh

1 + r

hh

校正的目的是因为测验题数多少对信度有一定影响,题数越多,信度越高。

α系数法的计算公式如下:

k  ∑S2

信度系数α = 1 − i

k - 1  2

其中 k 为题目数,Si 为每题考生得分的标准差,St 为考生总分的标准差。

该公式局限性小,客观题、主观题均能适用,计算可行,数值准确。在实际应用中,多用此法计算信度。

  1. 对测验信度的评价

信度系数的值域为[0,1],最大值为 1,说明测验的稳定?性极好;最小值为 0,说明测验结果完全不可信。一般学业成绩测验要求信度系数在 0.90以上,常达到 0.95。如果一份测验含主观性试题,信度可略为降低,但最好不低于 0.80。

提高测验信度的方法一般有:①适当增大题量;②试题的难度要适中;

③测验的时间要充分;④测验的程序应统一;⑤试题的排列应由易到难,以稳定学生的情绪,发挥出正常的水平。

  1. 效度

效度是指测验能实际测量出所要测量的特性或功能的程度,它是衡量测验有效性的重要指标。

在讨论效度时,应基于这样一个前提:测验总是针对一定的测量目的而编制的,如自学能力测验必定要反映学生在阅读、思考、质疑等方面的特性, 而不是简单地测量学生掌握了多少具体的知识。又如,用中考化学测验试卷来考核学生高中毕业会考的水平,是无意义、无效度可言的。因此,依据目标编制的测验必有效度,只是高低不同罢了。

教学测验的效度常分两类:第一类是内容效度,即指测验内容与所要测量的内容之间的符合程度,它是一个定性分析的指标,一般根据教学大纲、教材、测验的双向细目表来进行估计,粗略地判断出试题与测验目标之间是否相符,对其程度难以数量化。第二类是效标关联效度,即指测验分数与作为效标的另一独立测验结果之间的一致程度,可用相同考生在两项测验成绩的相关系数来描述。

  1. 效标关联效度的求法

效标是估计效标关联效度的主要依据,因而效标必须如实反映某个方面的特性和功能,具有一定的权威性。由于效标选择的困难,不少待求效度的测验难以同时获取效标分,常在一段时间之后以某次测验作为效标,来说明前面测验的效度。例如,以大学化学系一年级学生普通化学或无机化学成绩

(平均分)作为高考试卷的效标,求出高考分与效标分之间的相关系数 rx y, 即为高考试卷的效度。①这样求得的效度称预测效度。

如效标分和测验分同时获得,即考生几乎在同时参加了两次不同的测

验,其中一次是效标测验,对应的效度称为同时效度。无论哪一种效度,均可通过求测验分与效标分之间的相关系数而得到。

  1. 对测验效度的评价

效标关联效度的值域为[-1,1]。最大值为 1,说明该测验完全反映了

① 唐力等编著,化学教育测量,桂林:广西师范大学出版社,1989 年版,第 197 页。

测验目标和要求;效度为 0,说明测验与测验目标之间毫无关系;最小值为

-1,说明测验结果与学生的实际水平完全相反。在现实教学中,上述两种情形很少发生。一般要求标准化测验的效度系数为 0.40~0.70 之间。

效度系数的大小,受本测验与效标测验之间相似性的制约。两者相似性大,效度系数偏高;反之,效度系数则偏低。因此,有的测验效度系数较小即已符合要求(如北京师范大学心理系曾以 1979 年入学新生一年级的无机

化学成绩作效标,求得当年化学高考试卷的效度为 0.20),有时却要求 0.65 以上才认为是有效的测验。

值得提出的是,信度和效度虽都相对于测验而言,但两者的差异是很明显的。信度高的测验不一定效度高,而效度高的测验信度必定也高。

提高测验效度的一般方法有:①严格按照测量目标编制测验;②去掉试题中与测验目的无关的成分;③试题的难度要适当;④合理安排两次测验间隔的时间;⑤评分标准必须统一。