一 项目的难度分析

  1. 难度的意义及其计算

难度是指项目的难易程度。反映项目的难易程度的数量化指标叫做难度系数,简称难度。项目越难,说明能够正确回答该项目的学生越少,或对该项目学生能够正确回答的成分越低。对项目难度的计算,通常有两种方法:

  1. 用通过率计算难度。

当项目以二分法计分(答对得分、答错不得分)时,难度一般用正确回答 项 目 的 人 数 与 参 加 测 验 总 人 数 的 比 值 为 指 标 , 即 :

P = R

N

(式4-13)

式中,P 为项目难度;R 为答对该项目的人数;N 为参加测验的总人数。(2)用项目得分的平均值计算难度。

当项目是用连续分数计分时,难度一般用参加测验的全体学生在该项目的平均得分与该项目的满分的比值为指标,即:

P = X

W

(式4 - 14)

式中,P为项目难度;X为该项目的平均得分;W为该项目的满分。

用式 4-13 或式 4-14 计算所得的难度值与项目的实际难易程度正好相反。难度值越大,项目反而越容易。比如,P1=0.9,9 此项目难度小;P2=0.1, 此项目难度大。为了解决这一矛盾,有人提出将式 4-13 或式 4-14 改为

R

P = 1- N

X P = 1- W

(式4 - 15)

(式4 - 16)

这样,P1=1—0.9=0.1;P2=1-0.1=0.9,与项目的实际难易程度一致。不过,式 4-13 和式 4-14 是传统的难度计算公式,应用已十分广泛。本书的难度系数采用式 4-13 和式 4-14 计算。只要我们理解其意义,就不会造成认识上的混乱。

  1. 项目难度对测验结果的影响(1)对分数分布形态的影响。

试题中所有项目的平均难度就是试题的难度。难度不同的项目比例不同,试题的难度就不同,分数的分布形态也会因此而不同。比如,所有项目的难度都是 1,全部学生都会得满分;如所有项目难度都是 0,则全部学生都得零分。在这两种情况下,所有分数都集中在两个分数上(100 和 0)。可见, 过易或过难的测验,会使测验分数相对集中在高分段或低分段,这时,分数的离散程度小(标准差小)。

如果难度接近 0 的项目比例较大,得低分的学生较多,分数分布就会相

对集中于低分段,则分布呈正偏态;如果难度接近 1 的项目比例较大,得高分的学生较多,分数分布就会相对集中于高分段,则分布呈负偏态。当项目的难度成梯度出现,即从 0.1—0.9 的项目比例相同或接近时,项目的平均难度接近 0.5,此时分数的分布形态就最接近正态。

  1. 对测验的鉴别能力的影响。

当一部分学生能够正确地回答问题而另一部分学生不能正确回答时,两部分学生之间就形成了相互比较。在测验中,学生间相互比较的可能性越多, 就越有利于对学生进行鉴别。项目的难度不同,提供这种相互比较的可能性的程度也不相同。例如,当参加测验的学生数为 100 时,某项目的 P=0.2, 说明有 20 个学生答对了该项目,80 个学生答错了该项目,这时,学生之间相互比较的可能性为 1600 次(20×80=1600);如果 P=1 或 P=0,学生之间就没有相互比较的机会(100×0=0 或 0×100=0)。不难看出,当 P=0.5 时, 项目能够提供给学生相互比较的机会最大(50×50=2500)。所以,项目的 P 值越接近 0.5,对学生的鉴别力也就越大;同理,项目的平均难度即试题的难度越接近 0.5,试题的鉴别力也越强。

  1. 项目难度的评价

一个项目的难度值应该多大才合适?对此,并没有一个确切的数值为其答案。虽然项目难度在 0.5 时,其鉴别力最强,但这并不意味着项目难度在

  1. 时质量最高。评价项目难度是否合适的依据,只能是测验的目的。

在平时的形成性测验中,与化学教育目标相对应的测量项目都需要编入测验中,尽管这些项目在前置性测验中难度值可能为 0,而在后置性测验中难度值可能为 1,也不能将其舍弃而人为缩小测验取样的内容范围;在总结性测验中,需要对学生的学习成绩做出区分,要求测验的平均难度达到或接近 0.5,但为了保证取样的代表性,应当使各个难度水平的项目都有分布, 且比例适当。有时,还需要根据测验的特殊目的来配置难度不同的项目比例。例如,我们要挑选 10%的学生参加化学竞赛,项目难度应相对集中于 0—0.20 之间,使项目的平均难度控制在 0.1 左右。这样做虽然会使大部分学生不能完成测验,但能够达到选拔优秀学生的测验目的,项目难度的配置仍然是合理的。如果我们希望一次测验既要选拔最高水平的学生,又要找出那些需要进行个别辅导的学生,就需要使难度分别为 0.1, 0.5,

0. 9

1

的项目各占 3 左右。对于高考命题,在要求高考兼有为高校选拔合

格新生和评价中学教学质量双重职能时,这就不能只是简单地使项目难度都保持在 0.5 左右了,而需要精心配置项目的难度比例,使考试的及格率与录取率正好相切。这样才能既有利于高校选拔新生,又可避免不良的社会效应。

要对测验中的项目难度比例进行合理配置,必须在测验正式实施之前就对项目难度做出准确判断。要注意的是,仅仅依靠主观经验来确定项目难度是不够的,因为项目难度不仅取决于编制水平,还与被测学生的具体情况有关。一个本来很容易的项目,可能会因为学生由于某种原因没有学习过有关知识而变难;而一个很难的项目,也可能由于学生测前做过有关练习而变易。对被测总体中的某一部分学生来说是容易的项目,可能对另一部分学生来说是较难的项目。这就说明,P 值所反映的仅仅是项目的相对难度而非绝对难度。正因为如此,预测是十分必要的。