第二节 直线相关一、相关系数

直线相关适用于服从双变量正态分布的双随机变量。直线相关研究两个变量 X 和 Y 的互依关系,即 X 和 Y 协同变化的数量关系。

直线相关系数简称相关系数(correlation coefficient),用以描述两个变量直线相关的方向与紧密程度。总体相关系数用ρ表示,样本相关系数用 r 表示。由样本 n 对变量值(X1,Y1),(X2,Y2),⋯,(Xn,Yn)求 r 的公式为

r = =

∑ XY − (∑X)(∑Y) / n

[∑X 2 − (∑X) 2 / n][∑Y2 − (∑Y) 2 / n]

(10·8)

相关系数没有单位,其取值范围为:-1≤r(或ρ)≤1。

相关系数 r 的意义可用图 10-2 说明。若散点图呈椭圆形分布,X 和 Y 有同时增大或减小的趋势,则 0<r<1,称为正相关;若 X 和 Y 有一个增大、另一个减小的趋势,则-1<r<0,称为负相关。 r=1 为完全正相关; r=-1 为完全负相关。完全相关散点都在一条直线上,即 X 和 Y 有确定函数关系。两个随机变量不可能完全相关。r=0,称为零相关。零相关表示 X 和 Y 没有协同变化的数量关系,如图中所示常见的 3 种零相关情况。因此零相关实际可认为是无相关。注意的是:r 是就双变量(X,Y)的样本而言,就总体而言应该用ρ。

图 10-2 相关系数的意义示意图

例 10·3 求例 10·1 中某地 10 名女中学生体重和肺活量的相关系数。据表 10-1 有

r = 0.6945

该地 10 名女中学生体重和肺活量的相关系数为 0.6945。