试题的难度

  1. 难度的定义

难度是指试卷题目的难易程度。对于一个题目,如果大部分考生都能答对,该题目的难度就小;反之,如果大部分考生都不能答对,该题目的难度就大。

一个题目的难度大小除了与所测的内容本身的难易程度有关以外,还与试卷的编制技术和考生的知识经验有关。由于表述的不清楚或者因为考生没有学过,一个本来很容易的题目可能变得很难,这说明题目的难度具有相对性。

  1. 难度的计算

①二分法记分的题目

对于选择题、是非题等采用二分法记分的题目,难度通常以通过率来表示,即用答对或通过该题人数的百分比作为指标:

P = R × 100%

N

公式中 P 为题目的通过率,R 为答对或通过该题目的人数,N 为全体考生总数。

用通过率表示难度时,P 值越大,难度越小;P 值越小,难度越大。因此也有人将通过率称为易度,而将未通过率称为难度。

当考生的人数较多时,可以先将考生依据卷总分从高到低排列,然后将总分最高的 27%和最低的 27%的考生分别定为高分组和低分组,分别计算两组在该题目的通过率,然后用下式计算该题的难度:

P = PH + PL

2

公式中 PH+PL 分别为高分组与低分组的通过率。

在选择题中,由于允许猜测,选项数目越少,猜测的作用就越大,也就越不能反映题目的真实难度。为了消除猜测对难度的影响,有人提出了一个校正公式:

CP = KP - 1

K - 1

公式中 CP 为校正后的通过率,KP 为实得通过率,K 为选项的数目。

②非二分法记分的题目

对于论述题、问答题等不用二分法记分的题目,通常用下面的公式来计算难度:

P = X × 100%

Xmax

公式中X为考生在某一题目上的平均分,Xmax该题目的满分。

  1. 与难度有关的几个问题

①题目难度水平的确定

进行题目难度评估的主要目的是为了筛选题目,题目的难度是否合适, 取决于考试的目的、性质以及题目的形式。

在实际工作中,有些考试是为了了解考生在某方面知识技能的掌握情况,这时候对难度不必过多考虑,只要当局者认为重要的内容就可以选用。例如在资格考试中,为了检查考生对某部分知识的掌握情况,即使每个题目都有很高的通过率,这些题目仍然是可用的。大多数考试都希望能较准确地测量考生之间的差别,在回答某题时,如果考生对全对或全错,则该题就无法提供个别差异的信息。也就是说,当难度接近 0 或 1 时,考试就无法区分考生之间的差别。因此,为了使考试具有更大的区分能力,以选择接近中等难度的题目为好。

当考试用于选拔录用人员时,应该比较多地采用那些难度值接近录取率的题目。例如,要招收 20%的申请者时,题目的难度就应较高。

②试卷难度对分数分布的影响

试卷的难度直接依赖于组成试卷的题目的难度。通过考察试卷分数的分布,可以对试卷的难度作出直观检验。

由于人的多数心理特征是正态分布,而我们目前所采用的统计方法又大都以正态分布为前提,所以大多数试卷在设计时希望分数出现正态分布的模式。如果对考生的取样具有代表性,对于中等难度的试卷,其分数分布应呈正态分布。

试卷分数的分布背离正态分布有两种情况:一是题目的难度普遍较大, 考生的得分普遍较低,使得低分端出现高峰,呈正偏态;二是题目的难度普遍较小,考生的得分普遍较高,使得高分端出现高峰,呈负偏态。

当试卷的分数分布为明显的偏态时,可以通过改变题目难度的比例来加以调整,即根据偏离的类型来加入较易或较难的题目,删去或修改部分题目, 直到分布大体上正态分布为止。

当然,并不是所有的考试都要求其分数的分布为正态分布,对于标准参照性考试,例如证书考试,其分数分布就常常是偏态的。

③正态化等距难度

用通过率作为题目的难度指标,实际上是用顺序量表来度量难度,它仅仅能够表示题目难易的相对顺序,由于缺乏相等的单位,无法表示题目之间难度差异的大小。

由于我们所要测量的考生的特质深沉呈正态分布,因此题目的难度可以根据正态分布表转换为等距量表,即 Z 分数量表。在此量表上,不仅可以知道题目谁难谁易,而且可以知道题目之间难度差异的大小。但是,使用 Z 分数来表示难度常常会出现负值和小数,使用上不够方便。美国教育考试服务处(ETS)以 13 作为平均数,以 4 作为标准差,对通过率的 Z 分数进行线性转换,公式为:

△=13+4X

公式中△表示题目正态化等距难度,X 表示在正态分布图上,以题目通过率为面积所对应的标准差,当通过率小于 0.5 时,X 为正值,当通过率大于 0.5 时,X 为负值。由于 X 的取值一般在-3-+3 之间,所以经转换后的△值在 1-25 之间,当△等于 13 时,题目为中等难度,△值越大,说明题目越难。