表 2-2 检验相关系数ρ=0 的临界值(ra )表
p{|r|>ra}=α
|
α f |
0.10 |
0.05 |
0.02 |
0.01 |
0.0001 |
|---|---|---|---|---|---|
|
1 |
0.98769 |
0.99692 |
0.999507 |
0.999877 | 0.999998 |
|
2 |
0.90000 |
0.95000 |
0.9800 |
0.99000 |
0.999000 |
|
3 |
0.8054 |
0.8783 |
0.93433 |
0.95873 |
0.991160 |
|
4 |
0.7293 |
0.8114 |
0.8822 |
0.91720 |
0.97406 |
|
5 |
0.6694 |
0.7545 |
0.8329 |
0.8745 |
0.95047 |
|
6 |
0.6215 |
0.7067 |
0.7887 |
0.8343 |
0.92493 |
|
7 |
0.5822 |
0.6664 |
0.7493 |
0.7977 |
0.8982 |
|
8 |
0.5494 |
0.6319 |
0.7155 |
0.7646 |
0.8721 |
|
9 |
0.5214 |
0.6021 |
0.6851 |
0.7348 |
0.8471 |
|
10 |
0.4973 |
0.5760 |
0.6581 |
0.7079 |
0.8233 |
|
11 |
0.4762 |
0.5529 |
0.6339 |
0.6835 |
0.8010 |
|
12 |
0.4575 |
0.5324 |
0.6120 |
0.6614 |
0.7800 |
|
13 |
0.4409 |
0.5139 |
0.5923 |
0.6411 |
0.7603 |
|
14 |
0.4259 |
0.4973 |
0.5742 |
0.6226 |
0.7420 |
|
15 |
0.4124 |
0.4821 |
0.5577 |
0.6055 |
0.7246 |
|
16 |
0.4000 |
0.4683 |
0.5425 |
0.5897 |
0.7084 |
|
17 |
0.3887 |
0.4555 |
0.5285 |
0.5751 |
0.6932 |
|
18 |
0.3783 |
0.4438 |
0.5155 |
0.5614 |
0.6787 |
|
19 |
0.3687 |
0.4329 |
0.5034 |
0.5487 |
0.6652 |
|
20 |
0.3598 |
0.4227 |
0.4921 |
0.5368 |
0.6524 |
|
25 |
0.3233 |
0.3809 |
0.4451 |
0.4869 |
0.5794 |
|
30 |
0.2960 |
0.3494 |
0.4093 |
0.4487 |
0.5541 |
|
40 |
0.2573 |
0.3044 |
0.3578 |
0.3932 |
0.4896 |
|
45 |
0.2428 |
0.2875 |
0.3384 |
0.3721 |
0.4648 |
|
50 |
0.2306 |
0.2732 |
0.3218 |
0.3541 |
0.4433 |
|
60 |
0.2108 |
0.2500 |
0.2948 |
0.3248 |
0.4078 |
|
70 |
0.1954 |
0.2319 |
0.2737 |
0.3017 |
0.3799 |
|
80 |
0.1829 |
0.2172 |
0.2565 |
0.2830 |
0.3568 |
|
90 |
0.1726 |
0.2050 |
0.2422 |
0.2673 |
0.3375 |
|
0.1628 |
0.1946 |
0.2301 |
0.2540 | 0.3211 |
里的相关系数是根据要素之间的样本值计算出来的,它随着样本数的多少或取样方式的不同而不同,因此它只是要素之间的样本相关系数,只有通过检验,才能知道它的可信度。
一般情况下,相关系数的检验,是在给定的置信水平下,通过查相关系数检验的临界值表来完成的。表 2-2 给出了相关系数真值ρ=0(即两要素不相关)时样本相关系数的临界值 ra。
在表 2-2 中,左边的 f 值称为自由度,其数值为 f=n-2,这里 n 为样本数;上方的 a 代表不同的置信水平;表内的数值代表不同的置信水平下相关
系数ρ=0 的临界值,即 ra;公式 p={|r|>ra}=a 的意思是当所计算的相关系数 r 的绝对值大于在 a 水平下的临界值 ra 时,两要素不相关(即ρ=0) 的可能性只有 a。在前例中,f=10-2=8,在不同的置信水平下的临界值 ra 可以从表中查得:r0.1=0.5494,r0.05=0.6319,r0.02=0.7155,r0.01=0.7646,
r0.001=0.8721。由于 rxy=0.9214>r0.001=0.8721,这说明该地区粮食总产量
(x)与农业总产值(y)不相关的概率只有 a=0.001,即 0.1%,换句话说,该地区粮食总产量(x)与农业总产值(y)同向相关的概率达 0.999,即 99.9%。
一般而言,当|r|<r0.1 时,则认为两要素不相关,这时的样本相关系数就不能反映两要素之间的关系。
(二)等级相关系数的计算与检验
- 等级相关系数的计算
等级相关系数,又称顺序相关系数,与前述相关系数一样,它也是描述两要素之间相关程度的一种统计指标,不过在计算方法上,与前述相关系数的计算有所不同。等级相关系数是将两要素的样本值按数值的大小顺序排列位次,以各要素样本值的位次代替实际数据而求得的一种统计量。实际上, 它是位次分析方法的数量化。
设两个要素 x 和 y 有 n 对样本值,令 R1 代表要素 x 的序号(或位次),
R 代表要素y的序号(或位次),d2 = (R - R ) 2代表要素x和y的同一
2 i 1 i 2i
组样本位次差的平方,那么要素 x 与 y 之间的等级相关系数(r′xy)被定义
n
6∑d 2
为r′ = 1 − i=1
(4)
xy n(n2 − 1)
例如,我国 1985 年各省(市,区)的总人口(x)和社会总产值(y)及其位次列于表 2-3。试计算总人口(x)与社会总产值(y)之间的等级相关系数。
29
由表2 - 3计算可知:n = 29,n(n2 - 1) = 24360, d 2 = 1134,故
29
6∑d 2
i=1
i
r′ = 1 − i=1
xy n(n2 − 1)
= 1 −
6×1134
24360
= 0.726
即:总人口(x)与社会总产值(y)的等级相关系数为 0.726 2.等级相关系数的检验
与相关系数一样,等级相关系数是否显著,也需要检验。表 2-4 给出了等级相关系数检验的临界值。
表 2-4 的内容与表 2-2 的内容相似,n 代表样本个数,a 代表不同的置信水平,也称显著水
