(三)相关系数及其显著性检验
建立回归方程时,可以根据观察点配合一个直线方程表示 y 和调之间的关系。显然,此时所配的直线是毫无意义的,这就需要给出一个数量性的指标来描述两个变量间线性相关的密切程度,这个指标就是相关系数,常用字母 r 表示。所求相关系数的公式为:
r = lxy =
∑x y − 1 (∑x )(∑y )
i i n i i ②
l xy
由于b =
xx
,故相关系数 r 和回归系数数 b 有下列关系:
r = ③
显然 r 和 b 的符号是一致的。
|r|≤1,而且 r 的值反映了 r 和 y 的内在联系。现分析如下:
-
当 r=±1 时,所有点全在一条直线(即驾临直线)上。此时,称 x 与 y
完全线性相关。当 x=1 时称为完全正相关;当 r=-1 时,称为完全负相关。
-
当 0<|r|<1 时,这种情况很普遍,此时 x 和 y
存在一定的线性相关。当 r>0 时,称 x 和 y 是正相关;当 r<0 时,称 x 和 y 是负相关。
-
当 r=0 时,此时 b=0,故回归直线是与 x 轴平行的直线,说明 y
的变化和 x 无关,此时 x 和 y 无线性相关。
采用观察值计算出的是样本相关系数,要说明两总体变量是否具有线性相关,一般还需作假设检验。
设:H0:总体相关系数为 0
H1:总体相关系数不为 0 检验统计量为:
r 2
F = 1 − r 2 (n − 2) ④
可以证明,当 H0 成立时统计量 F 是服从具有自由度为(1,n-2)的 F 分布,因而给出显著性水平。a(通常 a=0.01 或 0.05)。当 F≥Fa(1,n
-2)时,则拒绝 H0,即说明两变量之间线性相关关系是显著的;反之,若 F
<Fa(1,n-2),则接受 H0,说明两变量线性相关关系不显著。