概率的相对频率观点

概率的相对频率观点,就其产生的文献数量和已发现的应用多样性来说,无疑是各种概率观点中最重要的。这种观点有若干变体,但从本质上说, 它依赖于这样的信念:在一事件的特定结果被记录下来的真实次数与事件的总数之间存在某种比率。给定事件的全集 R 以及表示了一定特性 a 的 R 子集

(我们将这一子集称作 A),那么在 R 中,A 的频率 r 由下式给出:

n( A) r( A, R) = n( R)

只要给出事件 R 的任何合理数目,就可以经验性地确定 r。相对频率观点进而假定当 n 增加时,r 趋于稳定,并假定“概率”一词的含意,可以由陈述概率 为这一比率的极限值而定义。因此:

简单的实验被用来说明 r 如何趋子稳定(见图(15 .1),在某些方面, 相对频率观点无疑在直观上是吸引人的。

它以确定这些概率的经验方法代替了概率的先验分配。这种方法将人为判断减少到最小程度,因此有时称相对频率观点为客观概率。但这种实际运算方法,并没有从笨拙的假定中摆脱出来。它假定存在某种假设的无穷大总体,它还假定可以估计极限的 P 值。仅当它能够表明事件结果的特定样本是整个总体的代表时,这才是可能的。相对频率因而涉及随机样本或随机试验的定义。

考虑下面的坛子模型。其中一坛装有 750 个红球和 250 个黑球,用一组不容更替的抽签来估计获得黑球的概率。因为结果是有限的,量是黑球的两倍,因此趋向于沉到坛子底部,概率的估计,就不会像在简单的掷硬币试验中那样,在极限值附近摆动,而是会逐渐变化。在结果无限的情形中,同样不存在结果的范围不会收敛在 0 和 1 之间任何数值上的理由(图 15.2)。

这样,相对频率观点用某种以“随机性”概念为基础来确定概率的运算方法,取代了概率的先验分配。然而克拉默(1954,5)指出:“看来不可能给随机这个词所包含的意义以精确定义。”这看起来很像通过某个其他不可定义的词,来定义一个不可定义的词。由于给出“随机”一词的可行定义, 比给出概率本身远为广泛的概念的确切涵义要容易得多,所以这只是部分情形。多数对于数学概率持相对频率观点的作者(如克拉默,1955;帕曾,1960; 费里尔,1957),通过实例来定义随机性。这样的定义,都严重依赖于说明某个简单的坛子模型或简单的博奕游戏。这种说明,通常包括陈述骰子的每一面都具有在一定玩法中发生的同等和独立的机会。随机性的这种直观推断的定义很重要,因为从中可以推导出事件的特定结果的数学性质。然后这些性质提供某种数学上的标准,据之可以测定一种给定结果,以决定其是否是随机的。但在后一种情形中,为了确定一定结果是否显著不同于随机结果, 就有必要采用统计推断方法。因而,“用相对频率来表示的概率定义,显然

以判断表示的概率定义为前提”(丘奇曼,1961,101)。

然而随机性可以通过抽样理论来定义。这种理论的目的是:(i)尽可能保证由发生的一定事件概率得出的估计,最后聚集在正确的数值上;(ii) 保证建立在特定样本基础上的估计,尽可能接近真实。当然,抽样理论非常复杂(参看科克兰,1953),这里不加以详细讨论。但重要的是认识这种方式:一种可行的定义给予随机性,因而给予相对频率的概率。一随机试验, 可以被定义成其结果独立于任何其他试验结果的试验。哈金(1965, 129) 指出:“实际上很难建立试验是独立的状态。”对这一困难的解决办法是“掌握一种标准的偶然性状态,并使所有随机抽样理论都依附于它。”这种必要的状况,由随机数论来提供。假如每一数字都具有同等且独立的发生机会, 这就会提供能显示出符合概率运算的一个数字序列。

随机数表,例如发表于 1955 年的 RAND 百万数字表,可以为抽样提供一个基本的偶然性状态。一般来说,若每一数字具有相同且独立的发生机会, 则随机数表具有可根据概率论预测的性质。但这样一种状态的困难是:状态内的某些区间可能不一致(哈金,1965,131)。肯达尔和斯图亚特(第一卷, 1963)曾论述了这一困难。他们指出,在 101010 数字表中,为了满足概率运算的需要,就得有一百万个零区间相当频繁地出现。

因此,预期在随机抽样数表中,将会出现其本身不适用的数字片。这种异常,必然会得到以恰当比例出现的机会,虽然比例很小。

在限定无限多的随机序列,并在产生这类序列的部分的特定例子上,存在着极大困难(丘奇曼,1961,158)。然而,“结合抽样程序而出现的随机性概念,对于今天正进行的大量研究来说是一基础。”但糟糕地是,这样的情况总是经常发生:“即人们试图断定身边发生的任何样本都是随机样本, 而这仅仅是由于能够利用可应用于随机样本,或与其关系密切的类似样本的统计分析技术的缘故。”费希本(1964 159—60)的评论为数量地理学家提出了一个有益的告诫。

因此,概率的相对频率观点指的是,在完全相同并因而相互独立的条件下所作的试验重复时,将现实世界概念化。假如现实世界过程的这种概念化表达是合理的,那么这些过程就能够融人为分析处理的概率的严格运算中去。而将现实世界事件这样融人概率论句法系统的合理性,取决于有效的抽样设 计,它保证每一事件可以从无数可能事件中随机选取。在抽样中确保随机性的这一运行步骤,并不是没有困难,因为它依赖于在一给定的抽样结构(如随机数的一个序列)中对随机性的概率检验。后一步骤基本上是归纳的,因此包含有此种论证形式中固有的、常常棘手的逻辑问题。