五、教育统计知识的应用

教育统计学是探讨如何应用统计方法,特别是数理统计方法,来研究教育,包括掌握教育情况,探索教育规律,制定教育方案,检查教育效率等一系列教育问题的一门科学。教学研究中统计学是通过对实验数据变异的研究,分离出偶然性因素,从特殊到一般,寻找必然性规律。因此,它是进行科学研究不可缺少的工具。

统计法是通过观察、调查、实验和测验,把得到的大量数据材料进行统计分类,以求得对研究的教育现象作出数量分析的结果。在化学教育科研中, 可以采用描述统计或推断统计。使用描述统计研究情况,例如整理实验或调查得来的大量数据,找出这些数据分布的特征,计算集中趋势、离中趋势或相关系数等①,可将大量数据简缩,找出其中所传递的信息。使用推断统计,

① 在统计中用一些有代表性的数目来近似地代替真正的值,这些数目就是集中量数,又称数据的中心位置、

即利用描述统计取得的信息,通过局部去推断全局情况。描述统计在分析实验法所取得的数据去正确评价学生成绩和考核命题质量等方面使用比较广泛。有关这方面的应用在第六章化学教学测量和评价中已作简述。这里通过实例介绍统计推断的基本原理及在化学教学研究中的应用。

(一)统计推断的几个概念1.总体和样本

  1. 总体 统计学把所要研究对象的全体称为总体,把组成总体的每个同类元素称为个体。一切由观察或测量总体的全部元素而得到的量数称为总体参数。总体平均值的符号为μ,标准差的符号为σ,总体单位数为 N。

  2. 样本 由总体中抽取出来的一部分个体叫作样本。表示样本的各种

数字特征的量数称为统计量。样本平均数的符号是X,标准差的符号为

σx 或 s,样本单位数为 n。样本对总体的代表性与抽样方法和样本容量的大小有关,样本过小,抽样误差较大,对总体的代表性较差,样本过大,浪费人力、物力和时间。一般认为 n<30 为小样本,n≥30 为大样本。若稍严格一些,n<50 为小样本,n>50 为大样本。

  1. 抽样方法

在教学研究中常挑选一些能代表全体情况的研究对象加以研究,即所谓解剖一个“麻雀”。抽样的目的在于科学地挑选“麻雀”作为研究的对象, 以便通过这局部的研究,可以取得能说明总体的足够可靠资料,准确地推断总体的情况,获得代表总体的规律性。以下简述几种抽样的方法:

  1. 随机抽样它的实质是从总体中抽取部分个体时,总体中的每一个个体被抽取的机会应该是均等的。随机抽样有抽签或使用随机数目表两种方法。采用随机抽样法时,一般先将总体中每一个个体都编上号码,但是总体相当大时,对每个个体编号比较困难;假如总体的单位数量较小时,随机抽样获得的样本代表性又较差,所以,在教学研究中一般不常用这种方法。

  2. 等距抽样等距抽样又称机械抽样。这种抽样方法是先将总体按某一标志排列,分为数量相等的组,使组数跟取样的数目相同,然后从每组中依事先规定的机械次序来抽取对象。例如,1985 年上海市高考有近二万八千名的考生,要抽样调查,采取按高考号码,25 人为一组,在 1109 组中抽取 1109 份试卷作样本调查,即为等距抽样。但由于高考号码是按学校依次编号,因此,这种等距抽样中还包含了分层抽样的因素。这种方法容易较均匀地从总体中取得样本,对于被研究对象变异程度较大,总体单位数较多时是比较适宜的。

  3. 分层抽样按与研究内容有关的因素或指标,先将总体划分成几部分,然后根据样本容量与总体的比率,从各部分内进行随机抽样或等距抽样的抽样方法。分层抽样应用比较广泛。

  4. 整群抽样整群抽样即是从总体中抽出来的研究对象,是以整群作为单位的抽样方法。前 3 种取样方法都是用从总体中抽取一个一个对象的方

集中趋势。它包括:算术平均数、中数、众数、加权平均数等。要全面地反映实际情况,在整理数据资料时,除必须求出一个集中量数外,还需要计算一个差异量数。差异量数(如常用的全距、平均差、变异数和标准差等)表示一组数据的差异情况或离散程度,测量的是分布的离中趋势。相关系数(r)是二列变量间相关程度的数字表现形式。它只是一个比率,不代表相关的百分数,更不是相关量的等单位度量。具体实例见本书第六章中关于考试效度和信度的确定。

法,当我们要研究某一种教学方法时,常以班为单位进行,这就应采取整群抽样。例如,在“大面积提高化学教学质量”研究课题中,总体是一个区的一般中学全体学生,而研究时以学校为单位,在一般中学中又有一般完中, 一般中学,基础较差的中学之分。研究组从三类学校中各选取 1 至 2 个学校的一个班级作为研究对象,这实际上是和分层抽样相结合的整群抽样。

  1. 标准误
  1. 抽样误差 从总体中抽取一定的样本进行研究,其结果与总体总不会完全一致。这种由于抽样而引起的总体指标(参数)与样本指标(统计量) 之间的差异称为抽样误差。抽样误差越大,样本所能代表总体的真实性越小。

  2. 平均数的样本分布和标准误 由于总体参数常常是未知的,因此, 如何来推测抽样误差的大小呢?抽样误差的大小常用平均数的标准误来表示。从样本平均数推断总体平均数,就要研究平均数的标准误。平均数的标准误就是平均数样本分布的标准差,用以表示样本平均数的分布情况。我们可以这样来理解:假如从某年、某市参加高考的学生中随机抽取 500 个组,

每组 50 人,每组可以得到一个平均分数,而 500 个组就有 500 个平均数。这

500 个平均数,由于抽样误差而各不相同,但是我们可以测得全体考生的平

均分数。我们会发现 500 个样本平均数大部分与总体平均数相近,少数与总

体平均数隔得远些。假如我们把 500 个样本的平均数列成次数分布图,这个分布叫做平均数的样本分布。而这个平均数样本分布的标准差叫做平均数的标准误,用符号SEX 表示。

计算平均数的标准误(SEX )的基本公式如下:

SE =

σ (15 − 1)

式中σ是总体标准差,n 是样本的含量。要计算平均数的标准误,运用上式需知道总体标准差(σ)的值。在实际工作中一般得不到这个数值,我们必须对它进行估计。由于样本是随机抽取的,样本的标准差(s)和总体标准差(σ)相差不多,而且二者具有正比例关系。因此,一般就用样本标 准差(s)代替总体标准差(σ)。由s估计SE X 时,上式可改写为:

s

SE = (15 − 2)

如果样本含量较小时,例如 n<30,用 s 代替σ时,一般所得结果偏小, 为了校正这种低估的倾向,从而得到较好的总体标准差(σ)的估计值,通常用自由度(n

  • 1)代替n。则计算SEX 时必须用公式(15 - 3)。

s

SE = (15 − 3)

从以上公式可以看出标准误与样本标准差成正比,与样本容量的平方根成反比,即样本的离散程度越小,容量越大,则样本平均数和总体平均数越相近,样本的代表性就大。

  1. 连续变量和不连续变量

连续变量是指在量尺上任何两点之间都可以细分,例如分数可以是10.2,10.23,10.235 等等,不连续变量是指在量尺上任何两点之间这个变

量所取的可能数字是整数,例如 1 个人,2 个人;第一名,第二名。5.小概率事件原理

它是指一种概率小到在一次观测中几乎是不可能发生的。例如,在一个口袋里装有红黑二种颜色的 100 个小球,但是不知它红黑球各有多少,现在

提出一个假设:“其中 99 个是红球”根据这个假设,我从袋中摸到黑球的概率仅是 0.01,机会是很小的,但是我从口袋里摸球时一次就摸出了一个黑球,这几乎是不可能的。因此,可以这样推理:“这个口袋里 99 个红球的假设推断和事实是相矛盾的”,因此,建立在 99%可靠度上推论出这个假设是不正确的。诚然,实际情况中也有很小可能性是一次就摸到一个黑球,因此, 我们否定它也要冒一些风险。

运用以上这些概念从样本推断总体,例如,取两个同等水平的班级,一个班进行教改,另一个不进行教改,通过一段时间教改以后用同一份试卷, 相同情况下对学生进行测试,取得实验班的成绩稍高于对照班的成绩。现在要问这两个班级是否有成绩提高的显著性差异,也就是判断这一差异是抽样引起的差异,还是本质差异,以此可以考察教改是否有效,是否值得推广; 如果无显著性差异,则说明这一提高可能是抽样等误差因素造成的。我们采取的步骤是先假设这两个班级成绩经教改后成绩没有显著差异,然后通过公式计算,得出的数据判断它是否属于小概率事件,如果属小概率事件就否定没有显著差异的假设,而推断它是有显著差异的。下面举几个实例来具体说明上述概念的应用。

(二)统计推断的应用

在“大面积提高化学教学质量”课题研究中,初中化学第一章的教学未进行教改试验,用同一张化学试卷测定一般完中和区重点中学各一个班的成绩如下:

一般完中(实验班)51 人

X=63.88 sX =15.76

区重点中学(对照班)46 人

X=75.14 sX =13.30

我们要求检验这两个班级平均成绩是否有本质差异。由于人数超过 30 人,因此我们可以采用:

  1. 独立大样本均值差异的显著性检验

①提出假设虚无假设 H0∶μ1=μ2(实验班和对照班无显著差异),研究假设 Ha∶μ1≠μ2(实验班和对照班不是来自同一个总体)

②求样本平均值之差

D = X 2 − X 1 = 75.14 − 63.88 = 11.26

③求样本的标准差

sX = 15.76 sX = 13.30

1 2

④求标准误

SE = = = 2.95

⑤大样本可以用 Z 检验

Z = D − 0 = 11.26 − 0 = 3.82

SE 2.95

⑥确定显著性水平α如确定α=0.05,Z 的理论值是 1.96(可以查标准正态曲线下的面积表,见附录Ⅲ),若计算出的 Z 值>1.96,则说明属于 95% 可靠度的小概率事件。如确定α=0.01,Z 的理论值是 2.58,若计算出来的 Z 值>2.58,则说明属于 99%可靠度的小概率事件,以上计算出的 Z 值是 3.82,因此有 99%可靠度推翻虚无假设,承认研究假设,说明这两个班级有显著差异,也就是说在教改试验前这两个班级来自不同的总体,一个班是区重点中学学生,一个班级是一般完中学生。

在初三第二章开始试行教改,教学结束后也用同一份试卷进行测试,通过统计推断来比较表 15-4 和表 15-5。