数据表示——图形的数学表示

已经指出,用图人辨别和评价地图里所含信息的能力,不会没有主观因素,地图中所含的信息越多,在对地图的解释方面所容易产生的含糊性和不确定性也越多。但是,度量地图信息的某些方面还是可能的,因而可以发展地图解释的客观方法。对地图信息的这些客观“解释”,实际上为我们提供了有关已制图的较高级别信息。因此,可以把地理信息看作是在不同的概括等级上提供的。

正如邦奇(1966 ,39)提出的,地图在这个等级体系中处于前地图

(premap)(以各种方式转达的原始信息)和数学(它提供关于空间信息结构的非常概括的陈述)之间的中间地带。

传统上,地图已成为地理学所掌握的主要资料贮存系统。把地图作为一种位置清单或记录的这一用法,现在已受到使用计算机磁带的挑战,磁带在贮存更大量的信息上有效得多。这种计算机贮存系统的运行还是非常昂贵的,但是很多规划机构正在推荐数据库以贮存这类信息,而很多国家级的人口调查现在正在发展这类计划(托布勒,1964;哈格斯特兰,1967)。从这种“低级别”的信息中,可以通过一种计算机加绘图仪自动地作出地图。然而,在提供自动地理信息系统时会产生很多方法论问题。这些问题反过来又与已作过较详细讨论、涉及地理个体和适于讨论地理分布的时空语言发展的那些基本问题有关。与这些问题相联系,存在着很多判读和地图投影的技术困难,托布勒(1964)和考(1963;1967)已讨论过这些困难,达赛和马布尔(1965.6)利用已讨论过的地图形式的基本语言概念来处理这些方法论问题。他们总结道:

地图、数学模型及其空间关系的表现形式都使用一种“语言”,但是这种语言在一些非常重要的方面都不同于日常语言、程序语言或逻辑学者共同采用的形式语言,⋯⋯一个重要区别是,二维相邻和并置并不是对语言连结的简单概括。相似性启示我们,制图学模型需要涉及更高维数的概念。看来地图语言是一种二维语言,研究这种语言必须考虑到它的二维结构。

达赛(1965B) 更进一步考查了这种二维语言的一些方面。但是,这里

的问题是,所有形式的地理信息(不论是计算机磁带上的、地图上的,还是数学等式型的)都要求用这种二维语言来分析。在地理学里已发展了一些一维坐标语言(见本章末尾注释以及第 259—262 页),但问题仍然悬而未决, 因为除非发展起二维语言,很多涉及地理信息交流(和解释)的问题将不能解决。这并不是否认一维语言作为交流载体又作为概括手殷的巨大成就。迄

今为止,我们关于地理学图式的所有基本分析,一直是利用此类一维语言进行的。已经指出,无论直接从数据还是从地图中对空间形式作普通坐标语言

(如纬度和经度)的相应概括都是可以的。但是,如果要用这些概括来讨论地理学图式,就有必要依靠采用需要作某些非常固定的假设的数学度量。另一方面,这些数学模型又使我们能对图式作出客观的陈述。这样,就能用某种客观度量来代替聚落图式之类的直觉描述(使用诸如“疏散的”、“集合的”等一类含糊术语)。

用以对图式作抽象概括的数学模型,有赖于我们表达对象或属性在空间分布的方式。地理学中任何数学方法的使用,都需要事先以使数学运算能够进行的方式对地理现实加以明确的概念化。可以认为空间分布现象能采取三种基本几何形式:(i)点;(ii)线;(iii)面;

对此我们还可加上较高维数的形式,如:

  1. 表面

  2. 强度;

  3. 流量;

  4. 组合。

通过其中一种方法对地理图式加以概念化,就可以把有关该图式的信息转换为数学语言,并利用这种语言的特性来概括该图式。可以作出此类概括的方式很多,因此,试图在这里涉及图式的每一种普通度量,从地方化系数

(the coefficient of localisation)和其它简单浓度测量到由光谱分析方法发展而来的复杂度量(哈格特,1965A 第 8 章,评论某些此类度量),是毫无意义的,但是考察一下对空间图式所作数学概括的某些特点却大有益处,因为这为我们提供了对地理学中一些基本方法论问题有价值的见解。

描述空间图式的数学模型可大致组合为两类(哈维,1968B) :

  1. 一般数学模型力图通过某种数学表达式的途径尽可能多地包含关于图示的信息。于是可以设计一种等式系统,使之概括成某种方式的资料, 并使我们能够描述其一般形式。最简单的概括方法大概是利用某种滤色镜来“ 平滑”空间图式,并得到成为原图式的平滑变体的地图陈述。好多得出概括描述的方法都已化成公式。詹克斯(1963)就这样考察了如何才能从原数据集中得出平滑了的概括地图,而哈格特(1965A,153—4 以及第 8 章)也已总结了很多此类技术。托布勒(1966B)通过对初始数据矩阵应用于一种平滑矩阵而发展了一种更为正式的此类概括方法,结果逐次得到更概括的地图( 图 19,4)。正如托布勒指出的,这种方法的优点是,它在转换各图的关系以及从转换应用平滑矩阵中发现初始地图方面是相对简单的。于是,概括表面和初始表面之间的关系就通过平滑矩阵的方法而牢固地确立了。

趋势面分析以其各种形式(见乔利和哈格特,1965B )也使对地图图式的概括陈述发展起来,并使图式的基本特征以参数是经验地决定的数学等式的形式保留下来。这样,就能够拟合这种形式的一个多项表达式:

Z=a+bU+cV+dU2+eUV+fV2+gU2+⋯⋯

式中 Z 为在整个空间改变数值的某种变量,U 和 V 为正交的定位坐标。用最小平方对该模型加以拟合就使实际表面分解为线性的、二次的、三次的⋯⋯组分,随着每一后续组分,得出总图式变化的一个特定量。这一方法已粗略地用以检验地理表面(克隆本和格雷庇尔 1965,第 13 章),并已在自然地理学和人文地理学中用来描述系统表面(乔利和哈格特,1965B )。

然而,此模型是一个纯描述的方法。例如,它假设所有参数都是线性的(一个非常固定的假设),而且对这些参数若无更进一步的证据,就不能给予任何经验的解释。

一个可资选择的表示空间表面的方法,是借助二维傅里叶分析(哈博和普雷斯顿,1968;卡塞蒂,1966)。这里,模型通过拟合,由包含余弦和正弦的一些项组成的数学表达式来描述。这种数学形式更为复杂,但是在原理上二重傅里叶级数分析与趋势面分析 别无二致。它直接把一个表面 z 的高度想象为是两个变量 x 和 y 的函数,这两个变量相互正交并包含周期性正弦和余弦函数的和(哈博和普雷斯顿,1968,223)。因此,认为这个表面是“在两个互相垂直的方向上振荡”。其振幅在二重傅里叶级数里被设想为规则的, 并且是周期性的。但是也可以把它们看成是不规则的和随机的。在这种情况下,我们就能够借助二维谱分析来检验空间模型的性质(巴特里特,1964; 布赖森和达顿,1967)。空间表面的谱描述,指的是将其概念化为二维平稳随机级数。

所有这些用数学手段描述空间模型的技术,都有一个共同特点:它们简直就是对数据集拟合某种先验的数学模型。这种模型不一定具有理论上的合理性,因而不能在进一步证明时给予任何真实世界的解释。但是,对这些先验模型却可以给予某种理论解释——这是一个经验问题——而即使不能作这种解释,在谨慎地建立模型时,以及很多情况下刺激有关空间图式的概括时, 它们仍起着某种有价值的作用。

  1. 特殊数学表示把空间图式与某种建立在关于过程的一些特殊假设基础上的数学模型联系起来。假设的过程通常是随机的。达赛(1964 A,559) 很详细地解释了其含义:

说一种分布在非技术意义上是随机的,就是说该图式毫无可辨的次序,就是说其原因不能决定。在数学统计的术语中,“随机”一词具有准确的含义,它指的是产生一种模型的过程,而随机模型就是一种理论随机过程的实现。

理论随机过程于是就提供了一种规范,依靠这种规范,就能度量某一特

定模型。可以利用这一规范来提供对模型的各种客观度量。这种途径已被用于一条线上的活动性序列(格蒂斯 1967 A;1967B)和地图图式,这些图式中,通过利用邻接度量(contiguitymelasures)可以研究不同“色彩”(色彩代表特别的特征)的区域(达赛,1968;克里弗,1968)。然而迄今为止, 最重要的方法是那些通过最近相邻分析和样方抽样而与点阵度量相联系的方法。

最近相邻分析以一种与空间点阵描述密切相关的方式,把几何学和概率论结合起来(肯达尔和莫朗,1963)。几何概率指的是在空间发现事件的概率。考虑一个模型,其中给定空间里每一位置都具有接受一个点的相等机会。这一模型相当于假设一个给一些点指定位置的随机过程。如果给出区域和所要指定之点的数量,那么就能从概率演算中得出预期的各种度量。顾名思义, 最近相邻度量指的是点间距离,而且给定假设的过程后,就能把距离分布计算为第一、第二、第三⋯⋯最近相邻(如果需要,可以直到 1,2,⋯⋯k, 部分),然后把最近相邻的实际距离度量与随机期望相比较。在由克拉克和埃文思(1954)发展起来的经典最近相邻技术中,构筑起一种从 0(所有点都位于同一点上)经 1(与随机期望一致)到 2.1491(一个极其规则的六边形分布)的标度。最近相邻为度量空间模型提供了一种简单的客观技术。达赛

(1962)曾用它来显示出布鲁什(1953)完全依赖目视检查描绘为具有显著规则特征的一个空间模型,实际上与随机期望非常接近。既然布鲁什已把聚落模型的表面规则性,用来作为中心地理论实际应用的肯定证据,这一客观检验就显得尤其重要。最近相邻方法已在地理学中得到广泛的应用,(达赛, 1960;1962;1966 A;柯里,1964;格蒂斯,1964;都提供了一些实例)。并已用于讨论植物生态学(格雷格一史密斯,1964)和地质学(米勒和凯恩, 1962)的一些问题。

而样方抽样则与在一确定面积区域(常称为样方)中发现 0,1,2⋯⋯ 个点的概率有关。如果点在研究区中的平均密度已知,火则也可以计算在随机期望下的那种概率。然后可能从随机期望里测量离差,并对模型建立各种度量。由于格雷格-史密斯(1964)提供了详细说明,而格蒂斯(1964)、达赛(1964 A )和哈维(1966B)提供了样方抽样在地理学中的应用实例,所以我们无需涉及这些度量的细节。

样方抽样和最近相邻度量都为我们提供了一种客观地描述点阵的某些一般特征的方便办法。这些描述参照某种假设的数学过程而构筑。于是就产生一个问题:这种假设的数学过程能否按照某种地理过程来解释。这种数学陈述能起到一个关于地理过程的先验模型的作用吗?原来在最近相邻距离度量和样方计数中,描述随机期望的特定数学法则就是泊松定律,而且正如我们已注意到的,它特别适合于研究能以随机项方式加以充分概念化的真实世界过程(见前文,第 319—322 页)。达赛(1964A,559)阐述道:

按照地图图式的术语,纯机会表示每一图上位置,都具有获取某种符号的相等概率。既然地理分布,尤其是涉及人类决定的区位模型,很难是相等可能事件的结果,那么对大多数地图图式,只能指望反映出某种系统或秩序。因此,为了证明一种空间过程,地图图式是要加以检验的。探索某种过程可以采取很多不同的途径。一种办法是得出一方面准确地描述地图图式的性质,另一方面提出隐含的空间过程性质的某种概率法则。

按照这-思路,达赛(1964A,1964B, 1966A,1966B,等等)曾在各种

实验情况下研究了地图图式和假设空间过程之间的相互关系。柯里(1964) 和哈维(1966B) 也提供了其它的例子。

这种用从某种假设的随机过程中构造的模型来“探索”地图图式的办法, 引起一些棘手的推理问题。这些问题多半与我们已确定为尺度问题(见前文, 第 418—421 页)的那些有关。牵涉到最近相邻分析和样方抽样的各种模型的度量,并非与点阵于其上得以分析的尺度无关。不同的样方面积得到不同的频率分布,并因此对假设的空间过程提供不同的证明。很小的样方(与点阵密度相对较小)总是得到一种泊松式分布,因此似乎表示空间过程是随机的。对同一点阵较大面积的样方抽样,可能产生负二项分布,并表示不同的空间过程种类。(见哈维,1968A)因此,一般而言,从模型分析中取得的关于过程的推论,并非不取决于分析的规模。最近相邻分析中也产生类似的问题, 虽然不太严重。这里的问题在于初始研究区域的确定,k 个部分的数量和定向,以及要度量成顺序相邻的编号。这种情形下的推理问题是,全部 k 个部分到第 j 序聚群(settlements)之距离的随机分布,并不一定意味着全部 k

+l 个部分到第 j +l 序聚群的距离分布也是随机的。

有可能详细地考虑这些推理问题,并在此过程中以技术性术语来表达一系列基本方法论问题。要考虑推理问题在达到最严格时的样方抽样。样方就是任意强加的区域单位,它被用来收集关于点阵的信息。可以选择任何大小

的区域单位(见第 417—421 页)。这样,样方就起着强加于连续分布的点密度表面上的区域个体的作用。现在假定概率模型的种类适合于那个图式,如果要作出关于图式与过程之间关系的推断,则有可能拟定某些样方抽样会满足的条件。例如,在一种简单随机模型中,每一样方必须具有等同而且独立的取得一点的机会。较复杂的模型在等同性意图方面较为灵活,但独立性仍是一个重要标准。这意味着在一定区域个体中得到的(任何类型)读数在统计上都应与任何其它样方中的读数无关。有可能通过考察空间分布总体中自动相关的程度来检验独立性。从技术意义上看,区域单元的最适合规模是, 其中滞后 1,2,3,⋯⋯k 步的总体自相关不显著大于零。这个条件突出了所测属性性质与所定区域单元大小间的关系。因为它还识别出其各种特征相互独立的总体,空间抽样问题就是有赖于它(见前文,第 433 页)。

区域单元的适当大小取决于所要考虑的现象在空间上如何分布,以及我们如何才能按理论条件将其看作那种使数据中的自相关程度达到最小区域个体。这并不意味着这些区域个体在欧几里得条件中一定是大小相同,由于被考察的现象最好是在非欧几里得条件下加以分析,在欧几里得地图上大小变动的区域单元将更为合适(并得到较小程度的空间自相关)。附带提及,这意味着欧几里得表面上的自相关函数是按其在整个空间上的形式而变化的。原来在自相关函数和谱密度函数之间有着一种特殊关系,其中一个是另

一个的傅里叶变换。这样就能够把地图图式的一种最一般陈述与我们在此考察的模型的特殊度量连接起来。在我们所有发展空间模式的数学描述的努力中,潜伏着一种企图,要识别不同波长、振幅及频率的空间变异的集成。既然谱分析的目标是识别某一特别频率段在空间图式的全部变化中的作用,我们或许能直接从这些数据中确定对空间变动最为重要的波长(组分)。这些重要波长又确定了在其上可发现有意义的空间自相关的尺度,并因此可以用来确定对于分析连续分布现象和组合分离现象起着基本地理个体作用的区域单元的最宜大小。

偏平表面、规则的几何表面(振荡的和非振荡的)等等,在地理学中相对少见。我们正寻求理解的现象,通常是不规则且杂乱无章地分布于整个“波状”类空间的,这种空间还常常被诸如地形的或政治的那种较大范围不连续界线打断。知识启示我们,不能把这一表面概念化为纯粹随机的——就象信息论称谓的“纯白噪声”。地理空间内存在着一些强烈的有机因素,它们常常能在地图图式中识别出来。但是问题是要在常常呈现完全不规则空间图式的那些事物中识别规则性因素。我们长期以来一直通过审视地图,并希望从中确实是我们所想看见的来寻求直觉地识别这些规则性。现在我们掌握了度量图式的客观方法,这些方法在运算上还与地理分析所面临的某些基本方法问题相联系。然而这一事实的广泛含义已在别处讨论了(哈维,1968B )。这样,地图图式数学表示的这些技术把三个重要方法问题——尺度问

题。空间图式的性质、空间图式及过程间的关系——综合起来。它们为更深入分析这三个问题提供了某种框架。只是在某种活动规模上过程才是有关的,而有关过程又根据所选择的分析尺度而不同。城内移居很可能要用与城间移居相应而又完全不同的变量来解释。过程和空间形式之间的关系,普遍地成为地理学者的基本关心点。我们对空间形式的描述完全取决于尺度,而相关的分析尺度只有根据某一过程的空间变化性及重要性才能决定。因此, 在图式和过程间有着密切的相互依赖,我们得以避免纯粹循环论证的唯一办

法,就是非常清楚地认识这些相互依赖的性质。

(注释:由于本章前后文中使用了二维(two-dimensional)这个术语, 可能会引起某种混乱。每一种简单语言(时一空或物质)都可以有若干维, 但在本章情况中,我们通过把两种不同语言汇集为一个信息系统而形成一种复杂语言。)