（三）应用位序—规模分布模式要注意的问题

位序—规模分布模式在中国的城市分析中经常被应用。应用得恰当很能说明问题，应用得不恰当却可能隐藏不少问题。在此，笔者对可能隐藏的问题作一些剖析。

位序—规模回归分析中的截距

按位序—规模分布模式的原意，log Pi=log P1-q log ri，截距 log P1 是最大城市的人口数的对数值。但在实际的分析中，常常把最大城市作为一个普通样本参加回归，得到回归方程 lgPi=a-blgri，其中的 a 是误差平方和最小时回归线的截距，实际是这种状态下，最大城市的理论值，把 a 当作已知条件（最大城市人口的对数）和把 a 当作待求的系数，所得到的回归方程是不同的，前者的误差平方和一般略大于后者，把两个 a 值恢复为人口规模可能会有很大的差距。忽视这一点是不允许的。究竟用哪一种，应根据不同目的慎重选择。图 59 是京津冀 1989 年 22 个 5 万人以上城市的两种不同的回归结果。当 a 为已知时，a=lgP1=lg 5692000=6.755，得回归方程 y=6.755- 1.455X（虚线）；当 a 不确定时，得回归方程（实线）y=6.972-1.655x，这时北京的理论规模为 937 万，比实际值大 65％。第一个方程的相关系数为0.868，第二个方

图 1 京津冀地区城市位序—规模分析

程是 0.987，结果很不一样。2.回归的相关性

城市的位序本来就是按照规模来排列的，这两个变量之间具有天然的相关性。并且城市规模以对数尺度表示时，人口规模差距的量级被大大缩小了。规模差 10 倍，对数值只差 1，规模差 2 倍，对数值只差 0.3。正因为这样，几乎在任何情况下位序—规模分析的相关系数都很高，笔者在研究中还从未遇到不能通过 a=0.01 显著性检验的实例，这一点具有很大的迷惑性。如果仅仅满足于能通过高度显著性检验，就轻易得出结论，认为该城市群体符合位序—规模分布，就可能得出错误的结论。

人所共知，湖北、广东、陕西、沪苏、云南等省、市、区有最典型的城市首位分布（见表 52）。但对这几个省区非农业人口 5 万人以上市镇的位序

—规模回归分析，都得到很高的相关系数，最低的云南也足以通过显著性检验。湖北、广东回归线的斜率（ b∃）的绝对值还小于 1，似乎是典型的位序

① 参见参考文献 44。

—规模分布（表 57）。然而注意一下首位城市理论值和实际值的巨大差异（此处都是理论值偏小），就可以理解，尽管相关系数很高，这种定量分析结果最好经过样本的逐一检验，确定实际误差才能用于实际，不能轻信定量结果。笔者