表 2-7 某地区城市公共交通营运额、人口数及工农业总产值的年平均数据

城市序号

公共交通营运额(y) (千人公里)

人口数(x1)

(千人)

工农业总产值(x2)

(千万元)

1

6825.99

1298.00

437.26

2

512.00

119.80

1283.48

3

1902.00

344.28

1128.33

4

146.00

235.56

600.58

5

2824.00

163.79

783.15

6

37.00

76.72

65.26

7

52.00

17.81

441.26

8

56.00

30.66

242.33

9

187.00

15.92

23.98

10

1065.00

345.08

371.98

11

107.00

6.70

324.40

12

173.00

28.00

262.11

13

771.00

75.00

1508.16

14

192.00

12.47

1072.27

据表 2-7 中的数据,我们有

 1 x11

x12 

 1 1298.00 437.26 

 

 x21 x22 

 1 119.80 1283.48 

X =  1

x31

x32

 = 

1 344.28 1128.33 

 Μ Μ

 Μ Μ 

1

x , x   1 12.47 1508.16

14 1 14 ,2

 y1 

 6825.00

 y   512.00 

 2   

Y =  y3  = 1902.00

   

 Μ  Μ 

y   192.00 

经过计算可得

b 0 

14  

− 172.2415

   

T −1 T

b =  b1  = (X X) X Y =  5.1075 

 b   0.3636 

故 y 与 x1 及 x2 之间的线性回归方程为

y = -172.241 5 + 5.107 5x1 + 0.363 6x2

(二)多元线性回归模型的显著性检验

(17)

与一元线性回归模型一样,当多元线性回归模型建立以后,也需要进行显著性检验。

与前面的一元线性回归分析一样,因变量 y 的观测值 y1,y2,⋯yn 之间

的波动或差异,是由两个因素引起的,一是由于自变量 x1,x2,⋯,xk 的取值不同,另一是受其它随机因素的影响而引起的。为了从 y 的总变差中把它们区分开来,就需要对回归模型进行方差分析,也就是将 y 的总的离差平方和 S 总(或 Lyy)分解成两个部分,即回归平方和 U 和剩余平方和 Q:

S 总=Lyy=U+Q

在多元线性回归分析中,回归平方和表示的是所有 k 个自变量对 y 的变差的总影响,它可以按公式

n ∧ k

U = ∑(y− y) 2 = ∑b L

计算,而剩余平方和为

a=1

n

i=1

∧ 2

Q = ∑( ya − y a )

a=1

= Lyy − U

以上几个公式与一元线性回归分析中的有关公式完全相似。它们所代表的意义也相似,即回归平方和越大,则剩余平方和 Q 就越小,回归模型的效果就越好。不过,在多元线性回归分析中,各平方和的自由度略有不同,回归平方和 U 的自由度等于自变量的个数 K,而剩余平方和的自由度等于 n-K- 1,所以 F 统计量为

U / K

F = Q / (n − K − 1) (18)

当统计量 F 计算出来之后,就可以查 F 分布表对模型进行显著性检验。在上例中,计算可得

14

S = L = (y

− y)2

= 44521048.53

总 yy

a

a=1

U=b1L1y+b2L2y=39030046.11 Q=S 总-U=5491002.42

U / K

U / 2

39030046.11 / 2

F = Q / (n - K - 1) = Q / 11 = 5419002.42 / 11 = 39.094

在置信水平 a=0.01 下查 F 分布表知:F0.01(2,11)=7.21。由于 F=39.094

>F0.01(2,11)=7.21,所以在置信水平 a=0.01 下,回归方程(17)式是显著的。

三、非线性回归模型的建立方法

在复杂地理系统中,除了线性关系以外,要素之间的非线性关系也是大量存在的。因此,对非线性回归分析,也有必要作一些介绍。

(一)非线性关系的线性化

前面已经讨论了线性回归模型的建立方法。在复杂地理系统研究中,对于要素之间的非线性关系,若能找到某种途径将其转化为线性关系,则我们就可以借助于线性回归模型的建立方法,建立要素之间的非线性回归模型。事实上,这是可以办得到的,只要根据要素之间的关系设定新的变量,通过变量替换就可以将原来的非线性关系转化为新变量下的线性关系。譬如:

(1)对于指数曲线 y=debx,令 y′=lny,x′=x,就可以将其转化为直线形式:y′=a+bx′,其中,a=lnd;

(2)对于对数曲线 y=a+blnx,令 y′=y,x′=lnx,就可以将其转化为直线形式:y′=a+bx′;

(3)对于幂函数曲线 y=dxb,令 y′=lny,x′=x,就可以将其转化为直线形式:y′=a+bx′,其中,a=lnd;

1 b 1 1

(4)对于双曲线 y = a + x ,令y′ = y ,x′ = x ,就可以将其转化为

直线形式:y′=a+bx′;

1

(5)对于S型曲线y = a + be-x

为直线形式:y′=a+bx′;

(6)对于幂函数乘积:

,令y′ = 1 ,x′ = e-x,就可以将其转化

y

y = dxβ1·x β2

,x βk

1 2 k

只要令y′ = lny,x = lnx1,x = lnx , ,x = lnx ,就

1 2 2 k k

可以将其转化为直线形式:

y′ = β

+ β x + β x + + β x

上式中,β0=lnd;

0 1 1 2 k k

(7)对于对数函数和:y=β0+β1lnx1+β2lnx2+⋯+βklnxk

只要令y′ = y,x = lnx ,x = lnx , ,x = lnx

,就可

1 1 2 2 k k

以将其化为线性形式:

y′ = β + β x + β x + + β x

0 1 1 2 2 k k

以上这种将非线性函数关系转化为线性关系的过程称为非线性关系的线性处理。不过,需要强调指出的是,这种转化过程并不能保证函数关系中变量个数不变。譬如,对于两变量的多项式

y=β0+β1x+β2x2+⋯+βkxk

若令x = x,x = x2, ,x = xk ,y′ = y,则它就被转化为多变量

1 2 k

的线性模型:

y′ = β + β x + β x + + β x

0 1 1 2 2 k k

(二)非线性回归模型建立的实例

通过上述分析,我们可以得到建立非线性回归模型的一般方法:首先通过适当的变量替换将非线性关系线性化,然后再用线性回归分析方法建立新变量下的线性回归模型,通过新变量之间的线性相关关系反映原来变量之间的非线性相关关系。下面,我们结合实例,说明非线性地理回归模型的建立过程。

例如,黄土高原某地区 1984—1990 年期间,小麦亩产量(y)与化肥使用量(x1),以及农家肥(干纯粪)使用量(x2)的数据如表 2-8 所示。试建立 y 与 x1 及 x2 之间的相关关系模型。