(五)多变量分析法

随着统计资料越来越丰富,除劳动力以外的社会、经济、文化领域的各种城市统计资料也日益齐备。同时,由于计算机技术的发展,人们驾驭大量的复杂变量进行客观性的分类成为可能。在西方社会里,特别是进入城市化高级阶段的发达国家,城市的社会问题日益突出,如种族和民族矛盾,收入水平和文化水平的差异,人口和家庭的频繁流动,新旧产业发展的不平衡等等,客观上也需要寻找这些城市问题发展的规律性。在以上背景下,一种不同于传统方法的多变量分类法发展起来了。当 60 年代地理学的计量化运动发展到高峰的时候,也正是这种城市分类方法最盛行的时候。常用的分析技术是主因素分析和聚类分析。

多变量分析法一般的程序如图所示(图 41)。

这种方法首先把所有的城市资料按 n×m 矩阵的形式排列起来。每一行对应于一个城市,每一列对应于城市特征的一个变量。然后分别进行行与行和列与列之间的相关分析,得到两套新的相关系数矩阵。

行的相关系数矩阵反映城市之间相似性的程度。相关系数越大,这一对城市在总体上越类似。每一个城市都有 n 个相关系数,这是分类的基本依据之一。

列的相关系数用来量测城市各个特点变化的相似性。两个变量的相关系数较高,表示它们在城市之间以非常相似的方式变化。经过分析,可能揭示出有些变量并不是互相独立的,而可能出于同一个母体。通过主成分分析, 可以把许多的变量组合成少数几个具有综合性质的“因素”,每个因素有不同的“承担量”,承担量大的前几个因素为主因素。每个城市对应于各个主因素有自己的一套因素率得分。这套因素率得分等于把每个城市放入一个多维的分类空间中,经过合适的归并技术就最后得到若干城市组群。分类结果基本上能达到城市组群间的高度差异性和组群内城市的高度相似性。

在许多多变量城市分类的成果中,最大的一个资料矩阵可能要数贝利1968 年的美国城市分类。他收集了 1762 个城市的 97 个变量。这样庞大的资料矩阵,若用人工分析,工作量难以想象,而计算机做起来却轻而易举。

应该指出,城市的多变量分类已经不限于城市经济的职能分类,而是扩展到包括经济、社会、文化等广义的城市综合特征的分类。从贝利在美国城市分类中对 97 个变量进行因素分析后所得到的 14 组因素就可以看到这一点

(表 44)。导致城市差异的主要