(二)集中量

对数据的概括了解,在统计学上常由二种量数来表示:一为表示集中趋势(central tendency)的集中量(或集中量数)(measure of central ten- dency);一为表示离中趋势(variation)的差异量(measure of variation)。常用的集中量有平均数、中数和众数。下面我们分别进行讨论。

  1. 平均数 一个物理量的真值是客观存在的,通常我们无法知道它的真值,而是通过测量或实验观测算出它的近似值。平均数(mean)或称算术平均数(mathematic mean)就是把一组数据加起来再用次数去除。它是刻画数据集中位置的极为重要的数。因此,平均数有两个意义:(1)对一组数据获得一个总的印象;(2)将此组数据和另一组数据进行比较。平均数是一个主要量数。平均数用符号 M 表示,其计算公式为:

M − ΣX

n

[ 公式 2 − 1]

X:每一个度量Σ:总和 n:度量的总次数

假如所测原始数据较多,可以进行归组计算,则求平均数的公式为

M = ΣfX′

n

[公式 2 − 2]

f:每组的次数

X':各组的均数

  1. 中数 中数(或中位数、中点数)(median,简称 Mdn)常用符号 Md 表示。中数是在按大小顺序排列的一组数据中,占中间位置的那个数。这个数可能是数据中的某一个,也可能不是原有数。中数是集中量数的一种,它能描述一组数据的典型情况,其特点是极少受极端数据影响。

单列数据的中数的计算方法十分简单。如果个数为奇数,则取序列为第

(n+1)/2 的那个数据为中数。如果数据为偶数,则取序列为第(n/2)或第

(n/2+1)这二个数的平均数为中数。例如有下列八个数,大小排列为: 3, 5, 6,9, 10, 11, 13, 16。序列为 n/2(即第 4 个数)的数为 9;序列为 n/2+1(即第 5 个数)的数为 10,则中数为第 4 个和第 5 个二个数的平均数,即(9+10)/2=9.5。

假如数据较多,也可以进行归组计算。则求中数的公式为:

M = L + (1 / 2×n − F)×i

d f

[公式 2 − 3]

L:含有中数那一组的真实下限n:度量总数 F:低于含有中数那一组的度量数i:组距 f:含中数那一组里的度量数

  1. 众数 众数(或密集数、通常数、范数)(mode,简称 Mo)通常用符号 M0 表示。众数是在整个分数里次数最多的一个度量,在分组的次数分配上便是次数最多的一个组的中点。它也是一个集中量数,也可用来代表一组数据的集中趋势。

众数计算起来很快,不论是分组的数据还是未分组的数据,都可用观察法来求众数。例如有一组数据为 4,5,6,5,7,5,3,6,不难看出 5 出现次数最多,因此众数为 5。

在数据整理成数据分布的过程中,同一数据由于分组组距的大小可变动,因此组距中点的数值也必随之而有改变,致使众数也有相当的移动。所以众数是不够稳定的,在比较结果时它只能用作约略的参考而已,因为众数受分组情况的不同而有所不同。

在心理学上,众数和平均数的差别能反映实验的难度。如果平均数大于众数,说明大多数人的度量结果低于平均数,可见在此实验中多数被试者存在低估的情况。反之,如果平均数小于众数,说明大多数人的度量结果高于平均数,可见在此实验中多数被试存在高估的情况。在统计学上,众数和平均数之差可作为分配偏态(skewness distribution)的指标之一,如平均数大于众数,称为正偏态(positive skewness);相反,则称为负偏态(negative skewness)。

以上我们讨论了三种集中量。统计分析时可选择使用一种、二种或全使用。一般而言,平均数和中数用得较多些。当没有极端数字影响,数据分布比较对称,此后的运算需要平均数时,应使用平均数。当数据中有极端数据, 数据分布不对称时,应使用中数。当需要很快估计出集中趋势或需要知道最多的典型情况时,应使用众数。另外,我们在日常体育和艺术比赛中,也广泛地使用这些集中量数。例如“去掉一个最高分,去掉一个最低分”等等, 都是为了能更好地反映集中趋势。