三、地理熵计算、应用实例

对地理熵的定义与计算,目前主要有两种途径,一是利用类比的方法建立地理学的“热力学熵”,而较多的是用信息熵的概念和方法,建立地理系统的信息熵。

熵的概念的提出者克劳修斯从热力学研究的角度出发最早将熵定义为:

ds = dQ

T

式中 T 是绝对温度,dQ 为系统在其所经历的过程中吸收的热量。

地貌学家通过研究认识到,地貌发育过程与热传导过程具有相似性,据此,60 年代初利阿波尔德(L.B.Leopold)与朗拜恩(W.B.Langbein)提出了地貌学熵的定义。他们将地貌参数与热力学参数进行类比,热力学是由温度 T 和热量 Q 来表示;而地貌场类似可用高度 h 和质量 m 来表现,即:

T←→h dQ←→dm

于是提出地貌学熵的定义

ds = dQ

T

但这一定义难于进行量算。

←→ dm

h

信息论创始人申农(c·E·Shannon)为了测定信息源的不定度,定义信息熵如下:

如果某事物具有几种独立的可能状态:X1、X2、X3、⋯、Xn,每一状态出

现的概率分别为 P(X1)、P(X2)、P(X3)、P(Xn),且有

∑ P( Xi )=1,则该事物的信息熵为i=1

H(X)= - ∑ P(Xi )logP(X i )

i=1

信息熵的定义则在数据获得及计算方面皆有较大实用性,可用来定义和计算区域地理系统的地理熵。例如它可用于对区域灾害群风险度的度量上, 即灾害群的不定度愈大,则破坏性愈大,风险度就大。

把能产生有限离散灾害事件的群体定义为事件源 D,其经典集合为 X:

n

{X1, , X },概率空间为{X: P( ) i},其中P ≥0, i=l, ,

n

n;且 ∑ Pi =1。则该灾害群风险熵为:

i=1

H(X) = -∑p i log Pi

i=1

对二维情况,i 取两项。

如三个地区主要灾害为旱、涝灾害,通过历史资料的分析可知三地区旱、涝灾频率如下:

地区

涝 1

20 %

80 %

2

40 %

60 %

3

50 %

50 %

则按上信息熵定义,计算三地灾害风险熵如下: H(X1)=0.216

H(X2)= 0.292 H(X3)=0.301

由上可见,旱、涝灾出现的频率愈接近,则风险熵愈大,当频率相等时, 熵最大,这时灾害种类的不定度最大,风险度最大。相反,灾害频率相差悬殊时,不定度小,风险度也小。

对于连续性分布,其信息熵可定义为:

+ ∞

H(X)= - ∫ - ∞P(X)logP(X)dX

其中 P(X)是随机变量 X 的分布密度函数。