第一节 灰色关联分析方法

在地理系统中,许多因素之间的关系是灰色的,人们很难分清哪些因素是主导因素,哪些因素是非主导因素;哪些因素之间关系密切,哪些不密切。灰色关联分析,为我们解决这类问题提供了一种行之有效的方法。

一、灰色关联分析概述

我们知道,统计相关分析是对因素之间的相互关系进行定量分析的一种有效方法。但是,我们也注意到相关系数具这样的性质:rxy=ryx,即因素 y 对因素 x 的相关程度与因素 x 对因素 y 的相关程度相等。暂且不去追究因素之间的相关程度究竟有多大。单就相关系数的这种性质而言,也是与实际情况不太相符的。譬如,在国民经济问题研究中,我们能将农业对工业的关联程度与工业对农业的关联程度等同看待吗?其次,由于地理现象与问题的复杂性,以及人们认识水平的限制,许多因素之间的关系是灰色的,很难用相关系数比较精确地度量其相关程度的客观大小。为了克服统计相关分析的上述种种缺陷,灰色系统理论中的灰色关联分析给我们提供了一种分析因素之间相互关系的又一种方法。

灰色关联分析,从其思想方法上来看,属于几何处理的范畴,其实质是对反映各因素变化特性的数据序列所进行的几何比较。用于度量因素之间关联程度的关联度,就是通过对因素之间的关联曲线的比较而得到的。

设 x1,x2,⋯,xN 为 N 个因素,反映各因素变化特性的数据列分别为

{x1(t)},{x2(t)},⋯{xN(t)},t=1,2,⋯,M。因素 xj 对 xi 的关联系数定义为

ξ (t) =

△ min + k△ max

t = 1, 2, 3, , M

(1)

ij

ij

(t) + k△

max

  1. 式中,ξij(t)为因素 xj 对 xi 在 t 时刻的关联系数;△ij(t)=|xi(t)-

x j ( t) │ , △ max

= max max △ ij (t),

j j

△ min

= min min △ ij ( t); k为介于[0, 1]

j j

区间上的灰数。不难看出,△ij(t)的最小值是△min,

当它取最小值时,关联系数ξij (t)取最大值 max ξij (t) = 1;

△ij (t)的最大

值为△ max,当它取最大值时,关联系数ξ ij

(t)取最小值 min ξij

i

(t) =

1

1 + k

 △ min 

  • k +

,

max 

即ξij (t)是一个有界的离散函数.

若取灰数k的白化值为1, 则有

1  △ min 

2 1 + △

 ≤ξ ij (t)≤1

max 

(2)

在实际计算时,取△min=0,这时有

0.5≤ξij(t)≤1 (3)

作出函数ξij=ξij(t)随时间变化的曲线,它就被称之为关联曲线(见图10-1)。图中的水平线,说明任何时刻的关联系数为 1,它代表 xi 与 xi 本身的关联曲线ξij≡1,因为自己与自己总可以认为是密切关联的。

关联曲线ξij(t)与ξij(t)与坐标轴围成的面积分别记为 Sij 与 Sii,则定义 xj 对 xi 的关联度为

γ ij

Sij

= S

(4)

ii

显然 Sii=1×M=M,所以(4)式可以进一步写成

γij=Sij/M (5)

在实际计算中,常用近似公式

1 M

γ ij≈ ∑ξ ij ( t)

i=1

(6)

代替式(5)或式(6)。

从以上关联度的定义可以看出,它主要取决于各时刻的关联系数ξij(t) 的值,而ξij(t)又取决于各时刻 xi 与 xj 观测值之差△ij(t)。显然,xi 与 xj 的量纲不同,作图比例尺就会不同,因而关联曲线的空间相对位置也会不同, 这就会影响关联度(γij)的计算结果。为了消除量纲的影响,增强不同量纲的因素之间的可比性,就需要在进行关联度计算之前,首先对各要素的原始数据作初值变换或均值变换,然后利用变换后所得到的新数据作关联度计算。初值变换的计算公式为

x (t) = x (t) / x (1)i = 1,2, ,N;t = 1,2, ,M (7)

均值变换的计算公式为

x (t) = x (t) / x i = 1,2, ,N; t = 1,2, ,M (8)

1 M

在(8)式中,x i = ∑xi ( t)。

i=1

二、实例分析

表 10-1 给出了某地区 1986—1990 年期间农业总产值及与之相关的各产业产值数据。我们用灰色关联分析方法对该地区各产业之间的相互联系作一些初步分析。

将表 10-1 中的数据作均值化变换后,在公式(1)中,取灰数 k 的白化值为 0.5,经过计算得如下的关联度矩阵: