二、基本定量方法
区域地理学要改变只定性不定量的静态描述,运用数学方法精确的分析,定量地解释地理事物及其联系是十分必要的。同样涉及区域地理特征的确定和分析,除上述定性方法外,也可采用一些数学方法加以定量。
(一)均值与标准差
均值与标准差是地理统计分析中最基本的概念。均值(平均数)是数据的一个重要数字特征,它反映样本(数据)的中心位置,也是总体平均值一个很好的估计。但是它还远远不能反映数据的全面情况。比如在分析某地的气温情况时,不只是要算出全年的平均值(年均温),一定还要看看各月的气温是比较一致呢,还是参差不齐两头走极端。样本(数据)的另一个重要的数据特征——标准差,正是刻划样本(数据)集中程度的。经常两个地区的某一特征从均值分不开它们间的差异,但从标准差则可看出。另外,一个区域的特征通常在中心地区显得明显,但在边缘,其特征就和相邻区的特征融合。在这些情况下,均值与标准差在分析区域的差异时都有一定的作用。
- 均值
假如分析甲、乙两地的年降水量,从 1972 年到 1977 年的年平均降水量如下:(单位:毫米)
降水量 年度 |
1972 |
1973 |
1974 |
1975 |
1976 |
1977 |
---|---|---|---|---|---|---|
地区 |
||||||
甲 |
900 |
920 |
900 |
850 |
910 |
920 |
乙 |
890 |
960 |
950 |
850 |
860 |
890 |
全部观测数据的总和除以观测总年份所得的商为均值。
均值X = ∑ Xi / N
i= 1
∑是累加符号 ,Xi 每年的观测值,N 是观测总年份,代入上述数据, 求得:
X甲=(900+920+900+850+910 + 920)÷6=900 X乙= (890+960 + 950+850 + 860+890)÷6=900
均值反映一组数的平均水平,从结果看,甲、乙两地年降水量没有什么
差异。但引入标准差后,情况就不同了。
- 标准差
上例,把每组中的值 Xi 减去均值 X 所得的差叫 Xi 与均值 X 的离差。把各离差的平方除以观测总年份(N)所得值定义为方差,用 S 表示,而开方后的 S,称为这种数据的标准差。
1 n
S2
n i=1
( Xi − X) 2 S =
用此公式计算
甲
Xi |
990 |
920 |
900 | 850 |
910 |
920 |
---|---|---|---|---|---|---|
Xi - X |
0 |
-20 |
0 | 50 |
-10 |
-20 |
(Xi - X) 2 |
0 |
400 |
0 |
2500 |
100 |
400 |
S2 = 1 / 6 × 3400 = 566.7 S = 23.8
甲 甲
乙
X |
890 |
960 |
950 |
850 |
860 |
890 |
---|---|---|---|---|---|---|
Xi − X |
-10 |
60 |
50 |
-50 |
-40 |
-10 |
(Xi − X) 2 |
100 |
3600 |
2500 |
2500 |
1600 |
100 |
S2 = 1 / 6 × 10400 = 1733.3 S = 41.6
乙 乙
S2 <S2 。方差、标准差反映一组数内部的偏离程度(集中程度),标
甲 乙
准差大的,表明偏离程度大。由结果看出,乙地的年平均降水量虽和甲地相同,但乙地各年的差异比甲地大得多,表明乙地年降水量变率大,不稳定。这样就看出了两地的多年降水量仍有较大差异,为区域特征的确定提供了依据。
(二)罗伦兹曲线和集中化程度指数
罗伦兹(Lorenz)是美国统计学家,他提出一种频率累积曲线,即罗伦兹曲线,该曲线主要用于不同地理现象在区域分布上的差异,尤其适用于不同经济地理现象在区域分布上的差异,查明它们的地区分布特征和规律。因此,在确定区域特征时是一种有效的定量方法。
现通过下面的例子,具体了解罗伦兹曲线的作法和在区域地理中的意义。
假设要研究某区域的冶金工业、机器制造业和食品加工业在其十个小区分布的情况,可以按各小区占这三个行业产值百分比大小,分别依次排列之, 作出表 4—2。
表 4—2 某区域有关行业分布的分析表
小区 |
位次 |
占本行业百分比 |
累计百分比 |