第二节 统计资料的类型

统计资料按研究因素(或研究指标)的性质可分为 3 种类型。

  1. 定量因素(定量指标)和计量资料定量因素是对个体的定量特征的描述,有大小和单位,称数值变量( numerical variable ),简称变量

(variable),其取值为数值,即变量值(value of variable)。如人的身高(m)、体重(kg)、血压(kPa)和红细胞数(1012/L)等;又如家庭人口数(人/家)和水中某种毒物含量(mg/L)等。由一群个体的变量值构成的资料称为计量资料(measurement data),即一群变量值。

  1. 定性因素(定性指标)和计数资料 定性因素是对个体的定性特征的描述,有类别。其特点是类别是客观存在的,各类无秩序,可任意排列;类和类之间界线清楚,不会错判。如人的性别有男和女 2 类,血型有 O 型、A 型、B 型和 AB 型 4 类等。一群个体按定性因素的类别清点每类有多少个个体,称为计数资料(enumeration data),即分类个体数。

  2. 等级因素(等级指标)和等级资料等级因素是对个体的等级特征的描述,分等级。其特点是级别是主观划分的,各级没有大小,但有秩序,必需自低(或弱)到高(或强)或自高到低排列,故等级因素又可叫做半定量因素;级和级之间界线模糊,可能错判。如疗效可分为无效、好转、显效和治愈 4 级,也可分为无效和有效 2 级;化验反应分为-、±、+、卄和■5 级等。一群个体按等级因素的级别清点每级有多少个个体,称为等级资料(ranked data),即分级个体数。

可把定性因素称为名义变量(nominal variable),其取值为各类;等级因素称为等级变量(ranked variable),其取值为各级。也可把定性因素和等级因素统称分类变量(cate-gorical variable)或属性变量,其取值为各类(把级也叫做类)。因此也可把计数资料和等级资料统称计数资料,即分类个体数。于是由数值变量值构成计量资料,由分类变量值构成计数资料。

不同类型的统计资料运用的统计方法有所不同,因此研究者首先要据因素或变量的性质来分清统计资料的类型,然后才能考虑选用正确的统计方法。

对于定量指标、定性指标和等级指标,考虑指标的客观性和敏感性,用定量指标描述个体是最好的。因此在医学科研中,根据研究目的确定研究指标首先应考虑选择定量指标,用计量资料的统计方法。

根据统计分析的需要,数值变量和分类变量可互相转化,从而使计量资料和计数资料可互相转化。例如脉搏数(次/分)为数值变量,一群人的脉搏数为计量资料,可划分脉搏数的数量间隔为<60 次/分、≥60 次/分和≥100 次/分,而把其转换成分类变量(或等级变量)的缓脉、正常和速脉,清点该群人脉搏数为缓脉、正常和速脉的人数,就成为计数资料(或等级资料); 性别为分类变量(或名义变量),男和女各有多少人为计数资料,可以令男为 X=0 和女为 X=1(也可令女为 X=0 和男为 X=1),而把其转换成数值变量, 一群 0 或 1 的变量值就成为计量资料;疗效为分类变量(或等级变量),无效、好转、显效和治愈各有多少人为计数资料,可以令无效、好转、显效和治愈为 X=0,1,2 和 3(或 X=1,2,3 和 4 等),而把其转换成数值变量, 一群不连续的变量值就成为计量资料。