二、基本定量方法

区域地理学要改变只定性不定量的静态描述,运用数学方法精确的分析,定量地解释地理事物及其联系是十分必要的。同样涉及区域地理特征的确定和分析,除上述定性方法外,也可采用一些数学方法加以定量。

(一)均值与标准差

均值与标准差是地理统计分析中最基本的概念。均值(平均数)是数据的一个重要数字特征,它反映样本(数据)的中心位置,也是总体平均值一个很好的估计。但是它还远远不能反映数据的全面情况。比如在分析某地的气温情况时,不只是要算出全年的平均值(年均温),一定还要看看各月的气温是比较一致呢,还是参差不齐两头走极端。样本(数据)的另一个重要的数据特征——标准差,正是刻划样本(数据)集中程度的。经常两个地区的某一特征从均值分不开它们间的差异,但从标准差则可看出。另外,一个区域的特征通常在中心地区显得明显,但在边缘,其特征就和相邻区的特征融合。在这些情况下,均值与标准差在分析区域的差异时都有一定的作用。

  1. 均值

假如分析甲、乙两地的年降水量,从 1972 年到 1977 年的年平均降水量如下:(单位:毫米)

降水量 年度

1972

1973

1974

1975

1976

1977

地区

900

920

900

850

910

920

890

960

950

850

860

890

全部观测数据的总和除以观测总年份所得的商为均值。

均值X = ∑ Xi / N

i= 1

∑是累加符号 ,Xi 每年的观测值,N 是观测总年份,代入上述数据, 求得:

X甲=(900+920+900+850+910 + 920)÷6=900 X乙= (890+960 + 950+850 + 860+890)÷6=900

均值反映一组数的平均水平,从结果看,甲、乙两地年降水量没有什么

差异。但引入标准差后,情况就不同了。

  1. 标准差

上例,把每组中的值 Xi 减去均值 X 所得的差叫 Xi 与均值 X 的离差。把各离差的平方除以观测总年份(N)所得值定义为方差,用 S 表示,而开方后的 S,称为这种数据的标准差。

1 n

S2

n i=1

( Xi − X) 2 S =

用此公式计算

Xi

990

920

900 850

910

920

Xi - X

0

-20

0 50

-10

-20

(Xi - X) 2

0

400

0

2500

100

400

S2 = 1 / 6 × 3400 = 566.7 S = 23.8

甲 甲

X

890

960

950

850

860

890

Xi − X

-10

60

50

-50

-40

-10

(Xi − X) 2

100

3600

2500

2500

1600

100

S2 = 1 / 6 × 10400 = 1733.3 S = 41.6

乙 乙

S2 <S2 。方差、标准差反映一组数内部的偏离程度(集中程度),标

甲 乙

准差大的,表明偏离程度大。由结果看出,乙地的年平均降水量虽和甲地相同,但乙地各年的差异比甲地大得多,表明乙地年降水量变率大,不稳定。这样就看出了两地的多年降水量仍有较大差异,为区域特征的确定提供了依据。

(二)罗伦兹曲线和集中化程度指数

罗伦兹(Lorenz)是美国统计学家,他提出一种频率累积曲线,即罗伦兹曲线,该曲线主要用于不同地理现象在区域分布上的差异,尤其适用于不同经济地理现象在区域分布上的差异,查明它们的地区分布特征和规律。因此,在确定区域特征时是一种有效的定量方法。

现通过下面的例子,具体了解罗伦兹曲线的作法和在区域地理中的意义。

假设要研究某区域的冶金工业、机器制造业和食品加工业在其十个小区分布的情况,可以按各小区占这三个行业产值百分比大小,分别依次排列之, 作出表 4—2。

表 4—2 某区域有关行业分布的分析表

小区

位次

占本行业百分比

累计百分比