(三)应用位序—规模分布模式要注意的问题

位序—规模分布模式在中国的城市分析中经常被应用。应用得恰当很能说明问题,应用得不恰当却可能隐藏不少问题。在此,笔者对可能隐藏的问题作一些剖析。

  1. 位序—规模回归分析中的截距

按位序—规模分布模式的原意,log Pi=log P1-q log ri,截距 log P1 是最大城市的人口数的对数值。但在实际的分析中,常常把最大城市作为一个普通样本参加回归,得到回归方程 lgPi=a-blgri,其中的 a 是误差平方和最小时回归线的截距,实际是这种状态下,最大城市的理论值,把 a 当作已知条件(最大城市人口的对数)和把 a 当作待求的系数,所得到的回归方程是不同的,前者的误差平方和一般略大于后者,把两个 a 值恢复为人口规模可能会有很大的差距。忽视这一点是不允许的。究竟用哪一种,应根据不同目的慎重选择。图 59 是京津冀 1989 年 22 个 5 万人以上城市的两种不同的回归结果。当 a 为已知时,a=lgP1=lg 5692000=6.755,得回归方程 y=6.755- 1.455X(虚线);当 a 不确定时,得回归方程(实线)y=6.972-1.655x,这时北京的理论规模为 937 万,比实际值大 65%。第一个方程的相关系数为0.868,第二个方

图 1 京津冀地区城市位序—规模分析

程是 0.987,结果很不一样。2.回归的相关性

城市的位序本来就是按照规模来排列的,这两个变量之间具有天然的相关性。并且城市规模以对数尺度表示时,人口规模差距的量级被大大缩小了。规模差 10 倍,对数值只差 1,规模差 2 倍,对数值只差 0.3。正因为这样,几乎在任何情况下位序—规模分析的相关系数都很高,笔者在研究中还从未遇到不能通过 a=0.01 显著性检验的实例,这一点具有很大的迷惑性。如果仅仅满足于能通过高度显著性检验,就轻易得出结论,认为该城市群体符合位序—规模分布,就可能得出错误的结论。

人所共知,湖北、广东、陕西、沪苏、云南等省、市、区有最典型的城市首位分布(见表 52)。但对这几个省区非农业人口 5 万人以上市镇的位序

—规模回归分析,都得到很高的相关系数,最低的云南也足以通过显著性检验。湖北、广东回归线的斜率( b∃)的绝对值还小于 1,似乎是典型的位序

① 参见参考文献 44。

—规模分布(表 57)。然而注意一下首位城市理论值和实际值的巨大差异(此处都是理论值偏小),就可以理解,尽管相关系数很高,这种定量分析结果最好经过样本的逐一检验,确定实际误差才能用于实际,不能轻信定量结果。笔者