一、测验分数的整理

  1. 编制频数分布表。

频数分布表是统计表中的一种,它是把一批分数进行分组归类,并登记在一张表上而制成的,这种统计表使我们很容易看出考生的整体概况, 为我们进一步分析和研究提供一个直观的初步印象。

频数分布表的制作过程如下:

先求全距。所谓全距就是一批分数的分布范围,即

全距=最高分-最低分

其次是定组数和组距。所谓组数就是所需划分的分数段个数,组距即为每一分数段包含的间距。组数、组距的确定与全距有一定的关联,即组距=全距/组数。原则上讲,在样本容量较大时,组距小些,组数多些,反之,样本容量较小时,组距可大些,组数可少些。在实际应用时,一般选取组数为 20 或 10,组距为 5 或 10。

再次是决定组限和求组中值。所谓组限就是每组的起止范围,一般规定每组的最低值为该组的下限,每组的最高值为该组的上限,在发表资料和计算分析时,可用组中值表示各组的组限。所谓组中值就是每组上下限的中点或者说是起终值的中点。用公式表示即为:

组中值=(组上限+组下限)/2 最后列频数分布表。

  1. 绘制频数分布图。

在进行数据统计时,除编制频数分布表外,为了便于进行深入细致的分析,一般还附有频数分布图。由频数分布表即可得到频数直方图,其作图方法是,在直角坐标系上,以横坐标代表分数,以纵坐标代表频数,在横坐标上标出各组的组中值,在纵坐标上等距标出频数值,然后以各组中值为中心,组距为底,各组频数为高,作出矩形,即可得到频数直方图。如果在频数直方图中,将每一组频数与组中值交的点,依次用直线相

连,就可得到频数多边图。

前面所述的图表法,只是对测验分数的一种粗略、直观的概括,要想深入了解并描述测验分数的全貌及各种特征,还需对测验分数作进一步整理与分析。

通常用来描述测验分数分布的总体特征的统计量有集中量和差异量等,它们从不同的侧面分别对测验分数的全貌及各种特征作出描述。

  1. 集中量。

它是用来描述测验分数集中程度的统计量,其主要统计功能是:反映频数分布中大量数据向某一点集中的情况。常用的集中量有算术平均数、中位数和众数等。

算术平均数( X)计算公式是:

X = ΣXi /N

式中X代表平均分数;Xi 代表第i个考生的分数;N代表考生总人数。

中位数(Md)就是依一定的顺序排列时,居中央位置的数据。如已知一组数据的频数分布情况,则中位数(Md)的计算公式如下:

M = L + ( N − n

d 2

i )i/fmd

式中 L 是中位数所在组的下限;N 是总频数;ni 是小于中位数所在组下限的频数总和;i 是组间距;fmd 是中位数所在组的频数。

众数(M0)就是一组数据中频数最大的那个数值,通常采用英国统计学

家皮尔逊提出的M 0 = 3M d - 2X公式来计算众数。

平均数X、中位数Md 、众数M 0 与频数分布的形态有一定的关系。当X = Md = M0 时,频数分布呈正态分布;当X>M d >M 0 时,频数分布呈正偏态分布;若X<Md <M 0 ,则频数分布呈负偏态,如图7—1所示

  1. 差异量。

描述一个分布,除了要考察分数的集中程度外,还必须考虑它的离中趋势,即数据的离散程度。差异量就是用来描述数据离散程度的统计量, 常用的差异量有全距、标准差等。

全距(R)的计算公式为 R=Xmax-Xmino 式中 Xmax 表示最高分;Xmin 表示最低分。标准差(δ)是最重要、最常用的差异量指标,其计算公式为:

δ = 1 Z(X n i

− X) 2

式中Xi − X为离均差;n为考生个数。