试题的难度

难度的定义

难度是指试卷题目的难易程度。对于一个题目，如果大部分考生都能答对，该题目的难度就小；反之，如果大部分考生都不能答对，该题目的难度就大。

一个题目的难度大小除了与所测的内容本身的难易程度有关以外，还与试卷的编制技术和考生的知识经验有关。由于表述的不清楚或者因为考生没有学过，一个本来很容易的题目可能变得很难，这说明题目的难度具有相对性。

难度的计算

①二分法记分的题目

对于选择题、是非题等采用二分法记分的题目，难度通常以通过率来表示，即用答对或通过该题人数的百分比作为指标：

P = R × 100%

公式中 P 为题目的通过率，R 为答对或通过该题目的人数，N 为全体考生总数。

用通过率表示难度时，P 值越大，难度越小；P 值越小，难度越大。因此也有人将通过率称为易度，而将未通过率称为难度。

当考生的人数较多时，可以先将考生依据卷总分从高到低排列，然后将总分最高的 27％和最低的 27％的考生分别定为高分组和低分组，分别计算两组在该题目的通过率，然后用下式计算该题的难度：

P = PH + PL

公式中 PH+PL 分别为高分组与低分组的通过率。

在选择题中，由于允许猜测，选项数目越少，猜测的作用就越大，也就越不能反映题目的真实难度。为了消除猜测对难度的影响，有人提出了一个校正公式：

CP = KP - 1

K - 1

公式中 CP 为校正后的通过率，KP 为实得通过率，K 为选项的数目。

②非二分法记分的题目

对于论述题、问答题等不用二分法记分的题目，通常用下面的公式来计算难度：

P = X × 100%

Xmax

公式中X为考生在某一题目上的平均分，Xmax该题目的满分。

与难度有关的几个问题

①题目难度水平的确定

进行题目难度评估的主要目的是为了筛选题目，题目的难度是否合适，取决于考试的目的、性质以及题目的形式。

在实际工作中，有些考试是为了了解考生在某方面知识技能的掌握情况，这时候对难度不必过多考虑，只要当局者认为重要的内容就可以选用。例如在资格考试中，为了检查考生对某部分知识的掌握情况，即使每个题目都有很高的通过率，这些题目仍然是可用的。大多数考试都希望能较准确地测量考生之间的差别，在回答某题时，如果考生对全对或全错，则该题就无法提供个别差异的信息。也就是说，当难度接近 0 或 1 时，考试就无法区分考生之间的差别。因此，为了使考试具有更大的区分能力，以选择接近中等难度的题目为好。

当考试用于选拔录用人员时，应该比较多地采用那些难度值接近录取率的题目。例如，要招收 20％的申请者时，题目的难度就应较高。

②试卷难度对分数分布的影响

试卷的难度直接依赖于组成试卷的题目的难度。通过考察试卷分数的分布，可以对试卷的难度作出直观检验。

由于人的多数心理特征是正态分布，而我们目前所采用的统计方法又大都以正态分布为前提，所以大多数试卷在设计时希望分数出现正态分布的模式。如果对考生的取样具有代表性，对于中等难度的试卷，其分数分布应呈正态分布。

试卷分数的分布背离正态分布有两种情况：一是题目的难度普遍较大，考生的得分普遍较低，使得低分端出现高峰，呈正偏态；二是题目的难度普遍较小，考生的得分普遍较高，使得高分端出现高峰，呈负偏态。

当试卷的分数分布为明显的偏态时，可以通过改变题目难度的比例来加以调整，即根据偏离的类型来加入较易或较难的题目，删去或修改部分题目，直到分布大体上正态分布为止。

当然，并不是所有的考试都要求其分数的分布为正态分布，对于标准参照性考试，例如证书考试，其分数分布就常常是偏态的。

③正态化等距难度

用通过率作为题目的难度指标，实际上是用顺序量表来度量难度，它仅仅能够表示题目难易的相对顺序，由于缺乏相等的单位，无法表示题目之间难度差异的大小。

由于我们所要测量的考生的特质深沉呈正态分布，因此题目的难度可以根据正态分布表转换为等距量表，即 Z 分数量表。在此量表上，不仅可以知道题目谁难谁易，而且可以知道题目之间难度差异的大小。但是，使用 Z 分数来表示难度常常会出现负值和小数，使用上不够方便。美国教育考试服务处（ETS）以 13 作为平均数，以 4 作为标准差，对通过率的 Z 分数进行线性转换，公式为：

△=13+4X

公式中△表示题目正态化等距难度，X 表示在正态分布图上，以题目通过率为面积所对应的标准差，当通过率小于 0.5 时，X 为正值，当通过率大于 0.5 时，X 为负值。由于 X 的取值一般在-3-+3 之间，所以经转换后的△值在 1-25 之间，当△等于 13 时，题目为中等难度，△值越大，说明题目越难。