三 几种常用信度的意义及计算方法

  1. 再测信度

用同一份试题对同一组学生前后实施两次测试,计算两次测验分数之间的相关系数,即得再测信度。这种信度能表示两次测验结果有无变化,反映测验分数的稳定程度,所以又称为稳定性系数。

当测验分数具有等距变量的性质(如化学教学测验分数常用的百分制) 时,再测信度一般用皮尔逊积差相关公式(式 4-3 或式 4-4)计算。

再测信度能够提供关于试题的测量结果是否随时间变化的信息。两次测验分数的误差变异主要来自测验条件和受测者身心状况的变化。再测信度

高,说明试题受学生状况和测验环境变化的影响小,可以认为试题是比较稳定的。但再测信度很容易受到练习和记忆的影响,前后两次施测间隔时间要适当。间隔时间太短,学生对第一次测验记忆犹新,练习影响大;但间隔时间太长,则学生身心发展与教学效果等足以改变测验分数的意义。

  1. 复本信度

如果用两份等值平行的试题测量同一组学生,再求两次测验分数的相关,其结果就是复本信度。这时同样可以用式 4-3 或式 4-4 计算。

当两个测验同时连续施测时(为了抵消施测顺序的影响,可以使半数学生先做 A 卷后做 B 卷,使另一半学生先做 B 卷后做 A 卷),分数变异主要来自于两份试题在取样上的差别,即两份试题的等值程度,所以,复本信度又称作等值性系数。如果两份试题在不同的时间施测,则分数的变异与试题的稳定性和等值性都有关系,这是对试题可靠性的最为严格的检验,其数值也相对最低;这时所得到的信度称为稳定性与等值性系数,或再测复本信度。复本信度的局限在于,由于复本之间的相似性,记忆或练习效应的影响

仍然不能完全消除;编制两份完全等值的复本也是比较困难的。3.分半信度

在测验没有复本且只能实施一次的情况下,可将测验项目分成对等的两半,根据学生在这两半测验中所得的分数计算相关系数,即得分半信度。

这种信度考察的是同一试题的两半项目之间的一致性,所以可称为内部一致性系数,其意义类似于等值性系数,但不同的是,这里的两个等值复本是在测验后由同一份试题划分出来的。

计算分半信度先要对测验分半。不同的分半法可能会得到不同的信度值。为了使两半基本等值,可将项目按由易到难的顺序排列编号,然后按奇数和偶数序号将项目分半。要注意使那些性质相同、联系紧密的项目分在相同的一半,否则会使信度值偏高。

由于分半信度实际上只是半个测验的信度,测验越长、项目越多,两半分数的相关就越高。因此,对长度不同的测验,要用斯皮尔曼- 布朗

(Spearman-Brown)公式对其信度值加以校正:

rXX

= 2rhh

1 + r

(式4 - 8)

hh

式中 rhh 为两半分数的相关系数;rXX 为校正后的分半信度。4.同质性信度

这里的同质性是指试题中所有项目之间的一致性。若测验中各个项目得

分相关较高时,不论项目的内容或形式有何差别,测验都为同质;相反,即使所有项目看起来都好像是测量同一特性,但项目得分之间的相关很低,测验仍然是异质的。测验越同质,同质性信度的值也越大,则说明试题的内部一致性程度越高。因而,同质性信度又称作内部一致性系数。

常用计算同质性信度的方法如下:

  1. 当项目采用二分法(项目只有通过或未通过两种分数)计分时,可用库德-理查逊公式(Kuder-Richardson formula),即 K-R20 公式计算:

K

1− ∑PiQi 

r = K •  i=1

(式4 - 9)

K −R20

1− K  2 

 

式中,K 为整个测验的项目总数;Pi 为项目 i 的通过率;Qi=1-Pi;

S2 为测验总分的变异数。

  1. 当项目属于论文式类型,采用连续分数计分时,可用克龙巴赫所创的a 系数公式:

K

1 − ∑S2

K  i=1 

a = 1 − K •  2 

 

(式4 - 10)

式中,a为信度系数;K为项目总数;S2为项目i得分的方差,S2

为试题总分的方差。

当项目以二分法计分时,项目得分方差

S2 = P ·Q (式4 - 11)

i i i

代入式 4-10 中,即得到式 4-9。可见,式 4-9 可看做是式 4-10 的一个特例。

现将信度估计的几种方法小结于表 4-1。从上述几种信度的具体意义看,似乎还没有找到一种完全适合于教学测验的信度估计方法。在利用信度评价试题可靠性时,要注意其局限性。