表 2-2 检验相关系数ρ=0 的临界值(ra )表

p{|r|>ra}=α

α f

0.10

0.05

0.02

0.01

0.0001

1

0.98769

0.99692

0.999507

0.999877 0.999998

2

0.90000

0.95000

0.9800

0.99000

0.999000

3

0.8054

0.8783

0.93433

0.95873

0.991160

4

0.7293

0.8114

0.8822

0.91720

0.97406

5

0.6694

0.7545

0.8329

0.8745

0.95047

6

0.6215

0.7067

0.7887

0.8343

0.92493

7

0.5822

0.6664

0.7493

0.7977

0.8982

8

0.5494

0.6319

0.7155

0.7646

0.8721

9

0.5214

0.6021

0.6851

0.7348

0.8471

10

0.4973

0.5760

0.6581

0.7079

0.8233

11

0.4762

0.5529

0.6339

0.6835

0.8010

12

0.4575

0.5324

0.6120

0.6614

0.7800

13

0.4409

0.5139

0.5923

0.6411

0.7603

14

0.4259

0.4973

0.5742

0.6226

0.7420

15

0.4124

0.4821

0.5577

0.6055

0.7246

16

0.4000

0.4683

0.5425

0.5897

0.7084

17

0.3887

0.4555

0.5285

0.5751

0.6932

18

0.3783

0.4438

0.5155

0.5614

0.6787

19

0.3687

0.4329

0.5034

0.5487

0.6652

20

0.3598

0.4227

0.4921

0.5368

0.6524

25

0.3233

0.3809

0.4451

0.4869

0.5794

30

0.2960

0.3494

0.4093

0.4487

0.5541

40

0.2573

0.3044

0.3578

0.3932

0.4896

45

0.2428

0.2875

0.3384

0.3721

0.4648

50

0.2306

0.2732

0.3218

0.3541

0.4433

60

0.2108

0.2500

0.2948

0.3248

0.4078

70

0.1954

0.2319

0.2737

0.3017

0.3799

80

0.1829

0.2172

0.2565

0.2830

0.3568

90

0.1726

0.2050

0.2422

0.2673

0.3375

0.1628

0.1946

0.2301

0.2540 0.3211

里的相关系数是根据要素之间的样本值计算出来的,它随着样本数的多少或取样方式的不同而不同,因此它只是要素之间的样本相关系数,只有通过检验,才能知道它的可信度。

一般情况下,相关系数的检验,是在给定的置信水平下,通过查相关系数检验的临界值表来完成的。表 2-2 给出了相关系数真值ρ=0(即两要素不相关)时样本相关系数的临界值 ra。

在表 2-2 中,左边的 f 值称为自由度,其数值为 f=n-2,这里 n 为样本数;上方的 a 代表不同的置信水平;表内的数值代表不同的置信水平下相关

系数ρ=0 的临界值,即 ra;公式 p={|r|>ra}=a 的意思是当所计算的相关系数 r 的绝对值大于在 a 水平下的临界值 ra 时,两要素不相关(即ρ=0) 的可能性只有 a。在前例中,f=10-2=8,在不同的置信水平下的临界值 ra 可以从表中查得:r0.1=0.5494,r0.05=0.6319,r0.02=0.7155,r0.01=0.7646,

r0.001=0.8721。由于 rxy=0.9214>r0.001=0.8721,这说明该地区粮食总产量

(x)与农业总产值(y)不相关的概率只有 a=0.001,即 0.1%,换句话说,该地区粮食总产量(x)与农业总产值(y)同向相关的概率达 0.999,即 99.9%。

一般而言,当|r|<r0.1 时,则认为两要素不相关,这时的样本相关系数就不能反映两要素之间的关系。

(二)等级相关系数的计算与检验

  1. 等级相关系数的计算

等级相关系数,又称顺序相关系数,与前述相关系数一样,它也是描述两要素之间相关程度的一种统计指标,不过在计算方法上,与前述相关系数的计算有所不同。等级相关系数是将两要素的样本值按数值的大小顺序排列位次,以各要素样本值的位次代替实际数据而求得的一种统计量。实际上, 它是位次分析方法的数量化。

设两个要素 x 和 y 有 n 对样本值,令 R1 代表要素 x 的序号(或位次),

R 代表要素y的序号(或位次),d2 = (R - R ) 2代表要素x和y的同一

2 i 1 i 2i

组样本位次差的平方,那么要素 x 与 y 之间的等级相关系数(r′xy)被定义

n

6∑d 2

为r′ = 1 − i=1

(4)

xy n(n2 − 1)

例如,我国 1985 年各省(市,区)的总人口(x)和社会总产值(y)及其位次列于表 2-3。试计算总人口(x)与社会总产值(y)之间的等级相关系数。

29

由表2 - 3计算可知:n = 29,n(n2 - 1) = 24360, d 2 = 1134,故

29

6∑d 2

i=1

i

r′ = 1 − i=1

xy n(n2 − 1)

= 1 −

6×1134

24360

= 0.726

即:总人口(x)与社会总产值(y)的等级相关系数为 0.726 2.等级相关系数的检验

与相关系数一样,等级相关系数是否显著,也需要检验。表 2-4 给出了等级相关系数检验的临界值。

表 2-4 的内容与表 2-2 的内容相似,n 代表样本个数,a 代表不同的置信水平,也称显著水