C.地理学中的概率推断

地理学者们在研究过程中曾长期采用非演绎方法，但只是在最近，他们才利用形式非演绎语言来为非演绎推断提供一种合理的方法。目前，统计推断提供了地理学者们所用的主要方法，因而我们将把注意力集中于地理学中概率推断这一方面。

雷诺兹（1956，129—32）在 1956 年指出，在地理研究中可以采用统计推断的形式程序，但这样做就形成了引起加里森（1956）反对的一些限制。加里森所指责的两条表述是：“具有地理意义的现象的有限数量充分多地分布，使它们自己被抽样”，以及“毫不奇怪，至少有一位地理学家召唤过‘基本理论设计的新统计系统来比配和解决我们自己的专业问题’。”加里森以“科学的逻辑方法是普遍的”为理由，对后一表述表示特别的反对。自这些

报警弹打响以来，地理学家对随着在地理学中应用统计推断的形式程序而产生的棘手问题，看来仍不约而同地保持着沉默。已有的这种批评，通常是反对运用任何定量技术的情感反应，而不是意图对研究统计推断某些实际困难的抵销。因此，这儿我们要对这一问题作某些探讨。

形式非演绎语言应用于地理学中的推断包括作出假设。其中一些假设是普遍的，出自将地理信息映射到如奈伊曼- 皮尔逊理论的基本运算中去的需要；一些假设，对于推断检验的特殊类型甚或个别形式是特有的。因此地理学家面临的问题是，在若干不同语言间作选择，并且在每一种语言内部，从可得到的整个装备中选择“最好的”一套推断规则，作出这样的选择决非易事，这样做，要求非常细致地了解地理学家的这个方面。进一步说，显然有越来越多的检验正在提出，其中许多都伴随着特定的思想状况。地理学家对推断问题的分析可以使他得出结论：虽然确实有适宜的检验，但没有一个是特别有效的；因而要求专门研究地理问题的特定检验。但是在满足这样的要求以前必须有大量的先验分析。一般来说，在特定情况中，一定推断方法的适宜性取决于：（i）真正存在的地理问题是吝能用适于这一方法的形式来表示，（ii）是否完成了对这一方法来说是必要的假设。在地理学中应用的统计推断技术，基本上是从具有“正统”频率思想的统计学家那儿得到的。所以我们将集中讨论地理学中应用传统统计技术的问题。其中包括若干步骤，我们将分别考虑它们。

以适于形式非演绎推断的方式来规定地理假设，涉及将真实的地理陈述转化成关于某种变量的频率函数的假设。这就要求用概率论的基本语言来表达统计假设。但真实的地理假设可以用各种语言来叙述。例如，从区位论导出的许多假设，被作为决定论的命题来表述。如我们己看到的（前文，第 166—170 页），对这些假设不能给予直接检验。因此，为了利用回归方法，加里森（1957）将农业区位论——由冯·杜能提出的——的决定论假设转化成统计假设。达赛（1966 A）同样将决定论的中心地模型转化成概串模型。我们必需肯定，将初始表述转化成为概率表述，应该是既合理又尽可能准确的（前文第 315—317 页）。
规定地理总体在两方面都是重要的。就一个特定的假设集而提出的这样一种规定，确定了假设的定义域。当我们为检验一给定假设而规定一个总体时，我们所假定的就是总体被假设所控制。可以出现三种情况：

假说完全控制总体。
假说没有控制总体。
假说只部分地控制，或只控制部分所规定的总体。

现在要提前说明假设的定义域很困难（前文，第 112—118 页）。因而第三种情况可能是科学研究中最突出的，特别是在早期阶段，它是面临最大概念困难的一种情况。因此我们所做的就是将其实的地理假设转化成关于地理总体的假设（以频率函数表示）。当然，关于地理总体，重要的第二点是：它们为抽样提供了基础，而样本一总体推断是属于非演绎推断的一个重要类型。

目前，极为重要的是，我们应该清楚，规定地理总体意味着什么。对于统计学家来说，总体只是由一些抽象集合组成。但对于地理学家来说，总体“包括一组对象、事件或具有直接意义的数字”（克隆本和格雷庇尔，1965， 61）。规定地理总体及其可作出的度量，基本上是地理学家的份内工作；这

里明确要求地理学中形成清晰的概念，这是形式数学分析的基本先决条件（前文，第 223—230 页）。然而，地理学家在分析他们所研究的总体性质和定义形式上，几乎没有下什么功夫。没有这样的分析，形式非演绎语言的运用就毫无意义。以下内容中有很多出自克隆本和格雷庇尔（1965，第 4 章）以及邓肯等人（1961），他们为地理学家提供了对这一问题具有巨大效益的处理办法。

总体的定义是一个概念问题。我们可以选择将世界上所有农场都看成是总体。东英吉利亚的所有农场形成了这一总体的子总体，但对于特定的研究，我们可以选择称所有的东英吉利亚的农场为总体。总体的定义取决于研究的性质。克隆本和格雷庇尔说：

这一总体的规定至少涉及三点考虑：（1）明确表达在对象或事件的总体中，什么构成个体或元素；（2）规定所要作的数值度量种类；（3）规定总体的范围。

因而地理总体的规定要求有地理个体的先验定义，这是曾经使地理学家

感到十分困惑的一个概念（前文，第 260—261 页）。一般说来，我们可以将地理总体划分为两种类型。这两种类型分别以（i）位置个体和（ii）属性个体为基础。在一定情形中，我们可以将（i）看作（ii）的归并形式，但这样做，我们会使自己陷入复杂的推导问题中。克隆本和格雷庇尔（1965，76）列举了一个典型例子，他们指出，组成海滩的对象总体可定义为（i）沙滩或

（ii）单个沙粒。在社会学中，同样的问题以（i）单位数据与（ii）个体数据的形式出现。邓肯等人（1961，43）详尽地研究了以这些不同方式规定总体的结果，并指出：“一个人获得各区域单位的一个数据集或若干个单位数据，它们只有某些性质与关于总体中个别项目的数据性质类似”。结果，根据区域数据所作的推断，是关于各区域在大小、组成等等上相似的各个相似总体的推断，而不能解释成为关于各个个体的推断。当然，这种情况的经典实例是生态相关和个体相关之间的区别。邓肯等人（1961，9）写道：

从区域数据提取的关于相互关系的推断，可以应用于单元而不是区域吗？例如，如果统计学家计算一个城市的每一人口普查片中外籍人口的比例，并将其与该普查片的本国人比例相关联，找到一正相关，那么他可以下结论说，外籍可能多于本地人吗？许多早期的工作⋯⋯似乎假定这样推断是合理的，虽然对于它们根本得不到数学的理论证明。w. S. 鲁宾逊在 1950 年指出：“它们没有在数学上证明是正确的，从区域相关推导出的个体相关，就量值来说可能严重偏差，就符号来说甚至是错误的。”

这一特定的观点有很大意义，因为地理学中相关方法的大多数应用，以

区域数据为基础，而得出的却是关于个体的推断；虽然古德曼（1959）已经表明，这样的推断只有在某些条件下才证明是正确的，但实际上这一工作几乎不考虑这个问题。这个问题部分取决于设想总体是由聚集的元素（如郡县或砂堆）还是个别元素（如农场或卵石）所组成，部分还取决于是否涉及到位置或事件。这些问题上的混乱是地理学中全部推断方法大量混乱的根源。没有假设，对一个总体所做的推断就不能扩大到其他总体；如果要应用推断方法，还必须设想我们具有一些同类标准，或至少有某些充分的加权指标来克服非一致性（例如托马斯和安德逊（1965）那种相关分析中的加权数据；也可参看本书第 19 章）。

假定可以陈述对象总体的充分定义，那就要求我们说明对这一总体所做的度量。如果总体被说成是世界上所有的农场，那么每一农场的几种属性如收入、规模、生产集约程度等等就可以度量。度量所涉及的一些方法论问题

将在 17 章中讨论，但此时我们只需要记住：度量过程有效地将对象总体转化成（或归属于）关于真实对象的数字总体。在统计推断中要处理的正是这些数字总体。在某些情况中，对象总体会只由一个成员组成，但对这一成员的重复度量会产生规模可观的数字总体——如在勘测和三角测量中，对同一基线的重复量测。为了将测量误差减少到容许的水平，在最后这一情况中，总体被概念化。

规定总体的范围也很重要。如果总体被限制于东英吉利亚的所有规模在半公顷以上的农场，那么我们的结论只关系到这一对象总体以及对它的度量。将结论在规定的总体之外做任何扩展，严格说来都没有道理。因此，一般可以下结论说：在规定总体时，克服的麻烦越多，在理解所作的推断时问题会越少。

规定抽样方法也成为进行非演绎推断程序的一个重要部分。抽样问题将在后面（19 章）详细讨论，但重要的是，要注意到统计推断从根本上与根据样本进行推断有关；如果要把这些样本与真实的假设联系起来用，它们就必须以如此方法来收集，即：它们是正被考察的对象总体和数字总体的代表，并与正考察的特定假设有关。
规定适当的检验方法在非演绎推断中是最困难的步骤之一。统计学理论为我们提供了一套模型装备，每一个模型都有特定的假设，而要求我们承担的任务是从整个可行检验装备中挑选一种，这一选择以此事实为基础，即它与包括在上文（i）、（ii）及（iii）中的方法最协调一致。大多数传统统计检验，规定度量至少是在区间标度上做的，也规定得到的数字总体应是正态分布的（因而样本分布在抽样误差限度内是正态的），并且样本规模要充分地大（一般要大于 30）。如果这些条件满足了，那么就可以采用整个一系列所谓参数检验。这就是费舍尔（1936；1956；1966）所提出并在奈伊曼-皮尔逊理论中也得以发展的那些检验。很明显，这些检验的运用包括有效的假设。例如，考虑作为“t”检验的基础的假设：

每一观测都必须独立于任何其他观测（即：得到任一观测，肯定不会妨碍得到任何其他观测的概率）。
观测必须是正态分布的。
总体必须具有同一方差（这就是同方差性条件）。
观测必须以区间或比率标度来度量。

这种特定的检验非常有效（从效用的统计学意义上说），但所包括的有效假设在地理学中很少能满足。在一些情况中，我们能显示出在数据方面满足了各个必要条件，但在其他情况中，我们不得不假定它们存在。幸而“t” 检验证明是很健全的，即使在所有的条件都不能严格地满足时也起作用。不过，我们可以用西格尔（1956，19）的话作为结论：

应用任何统计检验得出的所有决策，都肯定带有这一限定：“如果所用的模型正确，如果所要求的度量满意，则⋯⋯”显然确定一特定模型的那些假设越弱、越少，我们通过与这一模型有关的统计检验得出的决策，其需要作出的限定也越少。即假设越少越弱，结论则越一般。

因此，正在发展新的检验类型，虽然它们可能不太有效，但却可能更适

用于地理学情况。这些检验通常称作非参数检验和无分布检验，虽然如加尔腾（1967，341）指出的，头一个术语的确切含意是“非区间标度参数检验”，而第二个的真正含意是“非正态分布检验”，从这一意义来说，这些术语用

词不当。但是，由于其假设较弱的长处，效力的普遍降低有时却给这些检验带来更大的应用性。这里，地理学家必须是一位理智的决策者，因为他需要选择最可应用的和最有效力的检验，而这两个目标总是不相容的。因此在选择检验上，地理学家必须对经验性工作中，运用任何数学运算而来的一般问题的一种特殊情况给予解决，即选择对经验状况歪曲最小，同时对掌握和获取他所设想的目标而言又简易可行的模型。这是一种评价性程序，其中我们的确需要统计学家的指导。但统计学家并不总是像他们可能的那样来帮助我们。由于“t”检验的例子表现得实在太好了，需要导出的一种检验的理论假设，对应用于一特定数据集的检验，并不总是恰当的假设。统计学家并非总是愿意考虑这个，因此没有为他们导出的检验的实际应用提供充分的“行为准则”。图基（1962）指出，在将来这会成为统计分析的一个重要领域。若是如此，地理学家肯定受益。

一旦选取了特定的检验，推断的引出就是非常自然的步聚，因为规则已严格地制订出来。当然也有若干评价性决策可以产生于检验程序中，最重要的是所用的显著性水平，或确定检验的临界区间。在引出推断时，回想一下至今遵循的一般程序很重要，因为它们准确地告诉我们推断是关于什么的。形式上的推断程序，只是按照用特定的抽样程序方式得到的数字集合来检验一定的统计假设。因而推断涉及到数字总体，而不是对象总体。所以我们可以说，东英吉利亚农场的收入水平显著不同于威尔士农场的收入水平，但是我们不能进一步断定这些农场显著不同。这后一推断是由于扩大了形式推断才做出的。在加尔腾（1967，341）称之为关于真实假设（关于地理事实的）的推断和关于一般化假设（关于数据的）的推断之间存在某种要划分的区别。这两种假设的混淆，相当于检验的统计显著性和检验的理论显著性之间的混淆。如我们已看到的（前文，第 306 页），有许多情况，其中拒绝虚假设只为择一假设提供了非常弱的支持。甚至对择一假设是相当强的统计支持的证据，也没有动摇对地理解释的需要。然而，地理学家们经常表现的好象拒绝虚假设就为某种理论提供了理所当然的证据。明摆着的事实是它并没有提供。因此，在这点上，我们不得不面临从统计（数学）结论到真实的地理结论这种逆映射的困难。推断问题的这一方面，已超出形式非演绎语言的范围。

在这里，可以研讨一下地理学中非演绎推断的更深入的方面。

已经提到，形式推断包括根据充分规定了的总体进行抽样。应当明白，得出的推断只涉及到这一总体，没有假定它们不能扩大到另外的总体。有一些棘手的问题与这一条件有关，而在地理学中这些问题特别重要。这些困难已由加尔腾（1967，361—70）大致作了研究，后来的研究都以他的叙述为基础。

加尔腾开始着手的基本命题是：如果我们没有样本，统计检验就会出毛病。现在地理学中有若干情况，其中如果没有一些相当重要的假定，要满足这一条件就很困难。我们可以鉴别一些可能的情况。

例如，考虑这一情况：我们有关于美国 50 个州人均收入的数据。这些州形成了整个总体，人均收入的度量给我们提供了关于各州的数字总体。看来统计推断技术在这里没有进一步的假定就不能应用。可以适当假定：在每一州都有一度量误差，而且我们实际拥有的数据，是我们本来能做到的无数可能度量中的一个样本。因此，我们将数据概念化了，好象它们是一个从某一

假设全域中提取的样本。所以，这里对于运用统计推断技术的条件是，这些数据“可以认为是一个通过或多或少规定了的模型，从全域中产生的样本。”当我们要概括从具有特定时空位置的总体中产生的时空结果时，会出现

很不同的情形。例如，考虑达赛关于中心地概率模型的检验，这一模型用衣阿华州的聚落模式（大部分情况下）作为样本数据集。在这一实例中，真实总体由衣阿华州的城镇组成；达赛用了 99 个最大的。假如衣阿华州只是 99

个城镇，那么这 99 个就构成了全部总体。因此，没有某些进一步的假定，就不能断定统计推断的各个形式程序是否正确。这样的一个假定可以是：衣阿华州在某些方面是各处所有城镇体系的代表。衣阿华州因而成为各区域集合体中的一个个体，这一区域集合体可设想包括了全世界。但如果我们试图以这样的方式来扩大总体，我们实际上就正在把一个单元中找到的城镇于总体推广到各处所有城镇。这一推断的最后部分，包括从一个总体的一个样本中导出一般性结论，在任何情况下这都被认为是不容许的。对在特定时间点上收集的样本，也必须给予同样的批评，而在空间的有限区域和时间的有限范围内收集样本，则面临双重的概念困难。

对此，另一解决办法是建立一假设全域。所以，如果样本同于总体，我们就可以假定总体存在，并称其为假设全域。在衣阿华州的情况中，我们可以假定现存的 99 个最大城镇，是来自能够以几乎无限多种不同方式在任何空

间和时间关联域中产生的 99 个城镇的样本。在某些方面，这类似于测量误差的论证，只是它更一般化，由于它可使我们在非常薄弱的数据基础上确定“普遍的”假设检验，因而看上去很有吸引力。这样的假设具有很大意义。加尔腾（1967，307—368）写道；

既然一个“假设全域”总能在研究者心中以最少的想象力来构造，这就意味着，原则上所有的数据都应服从统计检验。

也有可能构造所有可想象的世界，并将我们的样本看成这一较高层次总

体的仅仅一个单元。结果我们会发现不可能检验假设，因为在若干可想象的世界这一总体中，我们只有一个样本单元（例如这个世界）。这一困难使加尔腾得出结论：

有必要规定一个上限，说：“这是我接受我的数据的水平”：然后看到确实有可能根据数据推广到这一水平（以及看到样本在空间或时间中并不聚集⋯⋯）。

“不像其他科学，地理学可以以同样的方式，发现能应用于地球表面相

对较小部分的原理的巨大用途”，因而地理学不得不利用高度地方化的总体和高度地方化的样本。在许多情况中，这些样本与总体本身分毫不差。在这些情形里，可给予地理学统计推断以很多不同的解释。看一下以下 5 种解释，

它们都可以置于划分衣阿华州 99 个最大城镇的统计研究中：

总体是衣阿华州所有城镇的集合，99 个最大城镇是一个样本。因此，从这一样本（它是有偏的，并且不管怎样，差不多总构成了总体）可以推断总体。
总体是在与衣阿华州相同的环境中找到的所有城镇的一个集合。在这种情况中，样本由衣阿华州城镇这一子总体构成，假定衣阿华州不管怎样，是在其他国家或州中发现的情况的代表。
总体是衣阿华州城镇所有可能格局的集合。在这种情况中，99 个最大城镇给我们提供了城镇可以排列的无限多种方式的一个样本。
总体是各处所有城镇的一个想象的假设集合，衣阿华州提供合理

的样本来代表城镇的这一假设全域。

总体是所有度量的集合。这些度最可以根据聚落之间的距离来进行，这里给出了控制分布的规定法则、而扰动则归咎于度量误差。

最后一条好象是达赛（1966 A）在他自己对衣阿华州城镇分布模式研究中给予的解释。他假定此模型是由中心地模型产生的，但实际区位偏离理论上的最优化，这是由可以设想成一种度量误差的某一误差项引起的。有了中心地模型，城镇总数以及衣阿华州的总面积，就可以计算一聚落到任何另一聚落理论上的距离。关于衣阿华州城镇之间距离所做的实际测量，则是对这个距离做的，包含有度量误差项的重复测量。假如模型正确，实际度量值应近似于在理论距离值周围的正态分布。我们已经注意到了达赛关于运用这一检验形式的模型的充分性结论（前文，第 168 页）。

还可以对以上所述的几种解释构筑进一步的变体，但重要的一点是阐明，如果不事先规定总体，如果不把统计推断（对其要应用严格的规则）与真实的推断分开，将如何发生混乱。

一般来说，地理学的统计推断问题（图 15.6 中做了概括），只能通过仔细评价适用于一些给定情况的检验方法，并结合充分规定在收集和处理数据时所作的假定，才能有效地解决。当然，可行的各种非演绎语言以及可行的各种检验方法，要内部协调一致，并要严谨地应用。但是将真实问题先验地映射人适于检验的运算中，以及将数学结论逆映射人真实的结论中，只有在作出假定后才可以办到。这里和大多数其他情况一样，也会产生误差和困难。但是作出假设，要比忽略它们的意义所犯的重大错误少。显然，现在是打破曾经统治着地理学推断方法的缄默的时候了。关于地理学推断中包括的基本问题的争论只会有益。这种争论无疑将揭示这样的意义：需要注意雷诺兹当初的预言；也将揭示这样的意义：如加里森（1956，429）认为我们应该做的那样，我们确实可以相信，“科学的逻辑方法是普遍的。”对逻辑学也应作如是观（必需这样，这是本书的一个基本观念），但应用这种逻辑的问题，在不同情况下是根本不同的。