(二)信息源与数据预处理

由于本系统需对上海市内人口分布、城市化和产业发展、城市住房和土地利用的结构进行研究,城市化过程包括中心城区的扩展、城市工业的扩散以及郊县城镇的发展(表现为农村人口向城镇的集聚),所以本系统的研究范围为上海市整个大城市区,即包括市区和郊区。

  1. 信息源选取:为了研究人口空间变化的过程,从上海市公安局户政处和上海市计划生育委员会收集到上海市 1970—1990 年各街道、各乡镇户籍统计资料,包括总人口数、出生数和死亡数,由于行政区划不断变动,人口按行政区统计,所以必须搜集行政区划变动资料。特别是几次大的变动,如上海市 1971 年 1∶100000 政区图,1979 年 1∶75000 地图、市区 1982、1984、1989 年行政区划图以及相应的郊县行政区划图,比例尺分别为 1∶155000 和

1∶425000。为了准确量算市区各街道面积的变动,又收集到 1984 年市区行政区划图,比例尺为 1∶20000。

由于户籍登记统计资料只统计上海市在户人口,而对无户口登记的人没

有统计。所以除了户籍资料外,又收集到上海市第三次和第四次人口普查的资料,作为户籍资料的补充。这些资料包括人口的自然、社会经济构成如性别、年龄、职业、行业、文化程度、婚姻状况、家庭构成、不在业状况等。共 377 个街道和乡镇。为了研究人口增长与产业发展的关系,还收集了上海

市工业分布 1987 和 1990 年的资料。

为了研究人口分布与住房、土地利用的关系,搜集到了华东师范大学根据上海市 1988 年 11 月对上海市区的航空像片解译的上海市中心城土地利用

现状图,比例尺为 1∶10000,共 14 幅图,土地类型共计 42 种。此外还有 82 年上海市第三次住房调查资料,包括市区各类住房及各类居住面积的户数、人口数和面积,共 120 个街道。

  1. 数据预处理:数据预处理主要包括地图数据和属性数据的规范化和标准化。
  1. 属性数据的标准化:由于人口户籍统计资料共有 21 年,在这些年中,行政区划、街道和乡镇名称和排列顺序发生了很大变化。再者为了便于人口各方面分析的一致,便于进行对比、连接和图形显示。因此各类数据在输入以前,应按照行政单元统一编号,同时修改手抄资料的错误,查缺补漏。

  2. 图片的标准化:是为图形数字化作准备的,因为高质量的地图能减少数字化后的工作,省时省工。首先将所需图片转绘到不易变形的聚脂薄膜上,这一过程既纠正原图上的错误,又要确保所绘特征符合各种制图标准, 点、线与原图一致,并且位置准确,连接点清晰、确切。