六、多变量分析法
随着统计资料越来越丰富,除劳动力以外的社会、经济、文化领域的各种城市统计资料也日益齐备。同时,由于计算机技术的发展,人们驾驭大量的复杂变量进行客观分类成为可能。在西方社会里,特别是进入城市化高级阶段的发达国家,城市的社会问题日益突出,如种族和民族矛盾,收入水平和城市化水平的差异,人口和家庭的频繁流动,新旧产业发展的不平衡等等, 客观上也需要寻找这些城市问题发展的规律性。在以上背景下,一种不同于传统方法的多变量分析法发展起来了。当 60 年代地理学的计量化运动发展到高峰的时候,也是这种城市分类方法最盛行的时候。常用的分析技术是主成分分析和聚类分析。
通过主成分分析,可以把许多的变量组合成少数几个具有综合性质的“因子”,每个因子有不同的“载荷量”,载荷量大的前几个因子为主因子。每个城市对应于各个主因子有自己的一套因子率得分。这套因子率得分等于把每个城市放入一个多维的分类空间中,经过合适的归并技术最后就得到若干城市组群。聚类分析可以不经过主成分分析,直接用资料矩阵经标准化后, 由计算机自动计算城市样本之间或城市组群之间的“距离”,进行逐级归并。
计算“距离”的方法不同,就形成了不同的聚类分析方法。
在许多多变量城市分类的成果中,最大的一个资料矩阵可能要数贝里1968 年的美国城市分类。他收集了 1762 个城市的 97 个变量。这样庞大的资料矩阵,若用手工分析,工作量难以想象,而计算机做起来却轻而易举。
应该指出,城市的多变量分类已经不限于城市经济的职能分类,而是扩展到了包括经济、社会、文化等广义的城市综合特征的分类。表 6-8 是贝里在美国城市分类中对 97 个变量进行主成分分析后所得到的前 14 个因子,从这些因子反映的内容就可以充分说明这一点,经济职能只占了其中的一小部分。
表 6-8 1960 年美国城市体系的特征因素
主因子号 |
因 子 特 征 |
变 量 数 |
---|---|---|
1 |
在城市等级体系中城市的职能规模 |
22 |
2 |
城市居民的社会经济地位 |
12 |
3 |
城市居民的生活史阶段 |
8 |
4 |
非白种人人口和住宅主权 |
7 |
5 |
最近的人口增长过程 |
6 |
6 |
经济基础:学院城 |
5 |
7 |
出生在外国或外国血统的人口比例 |
6 |
8 |
最近的就业增长 |
4 |
9 |
经济基础:制造业 |
3 |
10 |
在劳动中妇女参与的程度 |
4 |
11 |
经济基础:专门的服务中心 |
7 |
12 |
经济基础:军事 |
2 |
13 |
经济基础:矿业 |
2 |
14 |
在劳动中老年男子参与的程度 |
2 |
城市多变量分类在分类结果上也不同于传统的城市职能分类。因为分类的类别不可能由研究者事先确定,它只能由计算机输出结果后,由研究者逐一分析,对特征概括命名。每一类型所包含的内容比传统的城市职能分类更综合、更丰富。而对研究者来说,类别的命名也更困难,有时不得不更抽象。