概率论的演绎发展

概率论的各种定理,由科尔默戈罗夫于 1933 年整理成一个统一的公理体系。从此以后,设计了很多公理论述。麦克卡德和莫罗奈(1964,20)、林德利(1965,I,6—11)提出了大量差别悬殊的公理论述,而费里尔(1957) 提出了一个严格的、但非公理的说明。这里无意讨论这些公理表述。但重要的是要记住概率论与所有的公理性数学体系一样,只与各个未确定的事物之间的联系有关。这些公理提供了一套确定各种抽象本体之间关系的规则。然后可用这些规则推导定理,又可以把定理结合起来以推导更复杂的定理。

这些定理没有经验性含义,虽然它们可以用经验现象的术语给予解释。重要的一点是:数学上的概率论发展,无论如何不取决于对该理论的解释。如同任何公理体系一样,数学的概率理论依靠一套原始概念和公设的表

述。几何学运用诸如“点”和“线”这样的术语——概率论则运用诸如事件和样本空间这样的术语。概率论的原始表述来自集合论。这些表述,可以用与几何学的原始术语以点和直线来表示的同样方式给予解释。但这要求对概率论有某种一般解释,而且为说明起见,将给出一种频率表达。

数学的概率理论中的基本原始概念是样本空间。考虑一个我们掷一枚硬币的试验。所有可能的扔掷都被赋于特性,即形成一个样本空间。样本空间包括所谓的样本空间元或基本事件。在这一例中,每一基本事件可以是一次试验(掷硬币)的结果。我们用集合论概念,将样本空间定义为 A=(a1, a2,a3⋯)。然后我们可以考虑样本空间的任何子集,我们将其称为复合事件,或有时就称事件。在我们的例子中,一个事件可以是所有记为正面(头像)的抛掷。如果在样本空间中仅有两事件(如正面和背面),那么我们就有条件 A=(A1,A2)。这里介绍相互排斥事件的概念是很重要的,因为它对于数学的概率论发展也是个基本概念,如果由两事件相交形成的集合不含元

(或 A1∩A2=Ф,空集),就可定义为两事件相互排斥。在此例中,显而易见正面和背面就是相互排斥事件。至今,我们已用的所有术语对概率论来说都是基本的,并可把它们放到集合论语言中去。还要做的就是:将概率定义为在样本空间子集上确定的集合函数,简单地说,就是指将数值(元)分配给包括在样本空间中的事件的规则。这一规则将数值赋予获得正面的概率,

例如说 P(A1);也赋予获得背面的概率,例如 P(A2)。于是我们就可以阐述分配的数值必须符合的三个基本公理。

  1. 对于每一事件 E,P(E)≥0(即非负)。

  2. 对于必然事件 S,P(S)=1。

  3. 若 E∩F=(空集),则 P(E∪F)=P(E)+P(F),

这是附加规则,它表明两相互排斥事件之并集的概率为它们的概率的和。

以上表述为数学的概率理论提供了基础,当然,还有若干不同的可行形式,但它们都非常相似(帕曾, 1960,18;麦克卡德和莫罗利,1964,20; 林德利,1965,I,6。

在此,有必要稍微离开有关样本空间性质的主题,并特别要注意概率论对任何经验现象的应用,取决于找出适合这一抽象理论概念的可行定义(或解释)。在上面所举例子中,样本空间包括无限多个元,因为我们可以无限地掷硬币。然而,假定空间被想成只包括一副普通扑克的 52 张牌,在这种情况中,样本空间包括有限的元:虽然如果我们替换地抽样,就可以从中产生无限系列。假如我们问:抽一张牌的花色是什么?对此有四种答案,我们可以将样本空间想成包括四种互斥事件。但如果我们问:这张牌的数目或画面是什么?则样本空间就有 13 种互斥事件。因此样本空间可以根据我们希望如何将它概念化而随意变化。所以样本空间的数学概念,只是通过我们询问的问题才具有某种解释。正如帕曾所说(1960,11):

在概率论是随机现象的数学模型研究这一范围内,它不能为样本描述空间的建立制订规则。相反,随机现象的样本描述空间,是作为数学理论出发点的若干未定义的概念之一。一个人选择正确的样本描述空间来描述一种随机现象时所作的考虑,是将数学的概率理论应用于现实世界研究之艺术的一部分。

我们提出的问题是否合理,这是地理学的、而不是数学的判断。但如果

要利用概率运算,我们必需首先提出能使我们构筑样本空间的问题。同样, 数学理论也并未告诉我们,一种集合函数如何被分配给某一事件,虽然如果要采用概率运算,它确实告诉了我们必须满足的条件。因此,选取用以估计概率的特定方法是经验性的,而不是数学问题。

从概率论的公理中可以推导出大量定理。这些定理与包含在样本空间原始定义中的抽象,以及包括在这一样本空间中的事件完全有关。详述包括在样本空间中的点是作得到的,在此空间中,每一点(基本事件)对任一特定试验都有相当且独立的发生机会。然后可以推导出描述事件的各种概率函数的数学特性。所以,能够确定概率的分布,它们的特性也可以阐明。根据一个样本空间确定的最重要分布是二项分布、正态分布和泊松分布。在概率模型应用于实际情况时,它们具有非常重要的作用。

如果将相等机会这一条件放宽,就有可能通过概括或复合简单的泊松定理,得到整个复合级数或广义分布,如负二项或奈伊曼 A 型分布。独立性标准也可以放宽,推导出的定理就可以应用于一般随机过程。随机游动、马尔科夫链、排队论和更新论。出生-死亡过程、移居-迁移过程等等,都可以从数学概率的基本公理开始,用演绎方式加以研究。

数学的概率理论中所包括的命题和定理的整个复合体,这里不再加以评述了。巴特里特(1955)、费里尔(1957)和林德利已作了充分说明。但要简要地提一下两个命题,因为它们将概率论的演绎和归纳研究联系起来,并

有助于说明概率的概念,如何可以应用于某些经验现象。中心极限定理,以及它的远亲——大数定律,都是极为重要的定理。现将它们叙述如下:

  1. 中心极限定理说明:“具有有限均值和方差的大量同等地独立的分布的随机变量,标准化后均值为零,方差为 1,其总数近似于正态分布”(帕曾,1960,372)。

  2. 大数定律可以用若干不同方式来陈述。在目前情况下,可能最容易的是伯努刊形式,其表述为:“当试验次数 n 趋于无穷大时,在 n 次试验中成功的相对频率趋向于每次试验中成功的真实概率。从概率意义上即是说,当试验次数无限增加时,观察到 F 和 P 之间任何非零差的可能性越来越小”(帕曾,1960,229)。

中心极限定理和大数定律两者均可从概率公理中推导而出。它们为设想 P 收敛于某一极限值的各种频率解释,提供了理论上的证明。在频率解释中, 这两条定律经常被假定为真。但是,这两个定律也定义了在指定的抽样步骤情况下,从样本空间中抽取的样本之性质,并因此有助于在实际资料集合中, 为鉴别随机性提供标准。但在许多情况中,不可能指明这样的随机性,而这时频率论者通常满足于假定随机性。

中心极限定理和大数定律,对于概率的相对频率解释,具有很重要的意义。从数学样本空间重复抽样导致 r(A,R)收敛于 P(A,R),这样的收敛特性可用来说明一种“标准的偶然状态”,而随机抽样步骤可以其为基础(前文,第 285 页)。概率运算对于重复事件的应用,在相当程度上有赖于这两条定律。很多统计推断的经典理论也依靠这两条定律。

数学的概串理论为讨论简单和复杂的“随机”现象及不确定状况,提供了精致而有力的运算。这种运算的经验意义,取决于我们解释运算的能力。这种运算在地理学中的应用将在后面讨论。