归纳的数学处理

从拉普拉斯那时以来，为了证明归纳推论的概然真理来自数学的概率论，人们曾经做过各种不同的尝试。现在大家认为这些尝试都不成功，并且认为如果要使归纳论证正确有效，就必须借助于不是属于逻辑学家所可能想到的在逻辑上可能的各个不同的世界，而是属于现实世界的某种超出逻辑范围的特点。

这类论证中第一个就是由拉普拉斯提出的。它的正确的纯数学形式有如下面所说：

有 n＋l 个外形相似的口袋，每个口袋里有 n 个球。第一个口袋里的球都是黑球；第二个口袋里有一个白球，其余是黑球；第（r＋1）个口袋里有 r 个白球，其余是黑球。我们选择其中一个不知包含什么的口袋，并从中取出 m 个球。结果发现这些球都是白球。那么（a）下一个取出的球是白球，和（b）我们已经选出其中都是白球的口袋的概率是多少？

m + 1

答案是：（a）下一个球为白球的机会是 m + 2 ；（b）我们已经选出其中

m + 1

都是白球的口袋的机会是 n + 1 。

根据有限频率说这个正确的结果有一种简单明确的解释。但是拉普拉斯

m +1

推论出如果已经发现m个A为B，那么下一个A为B的机会是 m +1 ，而所有的A

m +1

都为B 的机会是 n +1 。他是通过假定给出n个我们对之一无所知的客体，其

中 0，1，2，⋯⋯n 个为 B 的概率都相等而得出这个结果的。当然这是一个荒谬的假定。如果我们换用一个荒谬程度稍小的假定，即认为每个客体为 B 或不为 B 的机会相等，那么下一个 A 为 B 的机会仍然是 1/2，尽管已经发现许多 A 为 B。

即使我们接受他的论证，如果 n 比 m 大得多的话，普遍归纳仍然不大可能，虽然特殊归纳可能变得具有很大的概然性。事实上他的论证已经成了只

有历史兴趣的东西。

凯恩斯在他的《概率论》中对于归纳做出了纯粹数学可能做出的最好处理，并且最后认为归纳是不充分的。他得出下面的结果

设 g 是一个概括性命题，x1，x2，⋯⋯是有利于这个命题的观察到的实例，h 是在有关范围内的一般外界条件。

假定 x1/h=x2/h=等等。

使 pn=g/h x1x2⋯⋯xn。

这样pn 就是普遍归纳在有了n个有利的实例之后的概率。写出g表示g

的否定，p0 表示 g/h，即这个概括命题的先验概率。

那么P_n

= P0

P + x1 x2 x n

/ gh(1 − P0 )

当 n 增加时，它就接近于 1 而以 1 为极限，如果

x1x2 x h P0

接近于 0 而以 0 为极限的话；如果有着有限量ε和η使得对于所有足够大的 r 来说，

xr / x1 x2 xr-1 gh＜1 - ε 并且P0 ＞η，

那么上面那种情况就会发生。

让我们研究一下这两种情况。第一种情况说有一个小于 1 的量 1-ε，在这个概括性命题为伪的情况下，使得在出现一定数目的有利实例之后，出现下一个有利于这个概括的概率永远小于这个量。让我们看它的一个失败的例，即“所有的数都不是质数”这个概括。当我们顺着数列看下去时，质数越来越少，在出现 r 个非质数之后下一个数本身为非质数的机会就会增加，并且在 r 保持不变的情况下接近必然性而以它为极限。所以这种情况可能失败。

但是第二种情况，即 g 在归纳开始之前就必须具有一个大于某个有限概率的概率，却更为困难。一般来说，我们很难看出有什么方法计算这种概率。对于一个从来没有见过天鹅或听说过天鹅是什么颜色的人来说，“天鹅都是白色的”具有多大的概率呢？这类问题是既不清楚而又意思含糊的，凯恩斯也看出这类问题使得他的结论不够令人满意①。

有一个简单的假设可以得出凯恩斯所需要的那种有限概率。让我们假定宇宙中事物的数目是有限的，比方说是 N。设β是一个由 n 个事物组成的类, 并且设 a 是一个由任意选取的 m 个事物组成的类。

那么可能出现的a的数目是 m( N!− m)! ，并且这些可能出现的

α包含在β内的数目是 m!(n − m)! 。所以“所有的α都是β的机会是

n!(N − m)!

N!(n − m)! ，而这是个有限数。这就是说，我们对之没有任何证据的每个

概括性命题为真的机会都是一个有限数。

① 我将在第六部分第二章里再来谈这个问题。

可是我却担心，如果 N 象爱丁敦所认为的那样大，那么使得一个归纳概括具有很高概率所需的有利实例的数目将会大大超过实际可能发现的有利实例的数目。所以这种摆脱困难的方法从理论上看尽管很好，却不能用来为科学实践找到合理的根据。

先进科学使用的归纳法与简单列举的归纳法有些不同。首先要有许多观察到的事实，然后有一个与所有事实都相一致的一般理论，然后又从这个理论引导出为以后的观察所证实或推翻的推论。这里的论证依靠反概率原理。设 P 为一个一般理论，h 为已经知道的数据，q 为有关 p 的一个新的实验数据。那么

p / qh =

(p / h)(q / ph) q / h

在最重要的情况下，q 是从 p 和 h 得出的结果，所以 q/ph＝1。因此，

在这种情况下，

p / h p / qh = q / h

由此可以看出如果 q/h 的值很小，q 的证实就大大增加了 p 的概率。可是这却不具有人们可能希望得到的那些结论。如果用“p”表示“非 P”，我们就有

q / h＝pq / h＋pq / q ＝p / h十pq / h

因为在已知h 的情况下，p蕴涵q，这样如果y＝

pq / h

p / h ，

我们就有p / gh = 1+ y 。如果 y 的值小，那么这将是一个很大的概率。现在有两个条件可以使 y 的值小：（1）如果 P/h 的值大，（2）如果 pq/h 的值小，也就是 p 伪而使 q 变得不大可能的那种情况。计算这两个因子所遇到的困难正和凯恩斯的讨论中所出现的困难一样。为了算出 p/h，我们需要具有某种在发现使我们想到 p 的个别证据之前，计算 p 的概率的方法，而这种方法却

是不容易找出来的。我们看得清楚的只是如果一个让我们想到的定律在发现

任何有利于它的证据之前就具有相当大的概率，那就一定要依靠一个大意是说某种相当清楚的简单定律必然为真的原理。但这却是一个困难的问题，我在以后还要谈到它。

在某些种类的情况下，对于pq / h 进行近似计算具有更大的可能。让我们拿海王星的发现作例。就这个实例来讲，p 是万有引力定律，h 是海王星发现以前关于行星运动的观察，而 q 是海王星存在于计算表明它所应该存在的

地方。这样 pq/h 就是在万有引力为伪的情况下，海王星出现于它所在的地

方的概率。这里我们必须对于我们所用的“伪”这个词的意思做出一条规定。就这个词的适当意思来讲，认为爱因斯坦的理论证明牛顿的理论为“伪”是不正确的。在肯定一切表示数量的科学理论时都应该保留误差范围；如果做到了这一点，牛顿的万有引力学说对于行星运动来说就仍然为真。

下面的论证看来似乎今人抱有希望，但是在事实上却是不正确的。

就我们所举的实例来讲，脱离开 p 或者某个一般定律，h 对于 q 就是无关的；这就是说，对于其它行星的观察不能使海王星的存在具有比原来更多或更少的概率。至于其它定律，我们也许可能 411 认为波得定律使得有一个

大体具有海王星轨道的行星存在从大体上看是可能的，但是它却不能指明在某一特定日期行星已经走过的一段轨道。如果我们假定波得定律以及万有引力以外的任何其它有关定律给予认为有一个大体沿着海玉星轨道运行的行星的假定以概率X，并且假定对于海王星的视位置的计算带有误差范围ϑ，那么海王星在它所在的位置被发现的概率就将是ϑ / 2π。现在ϑ的值很小而x的值也不能认为很大。所以pq / h，这个值等于xxϑ / 2π，就必然很小。假定我们把X 作为1 / 10，ϑ作为6分钟，那么pq / h＝1 / 10x×3600＝1 / 36，

000。所以如果我们假定 p/h＝1/36，我们就将有 y＝1/1000 和

p / qh = 1000 。

1001

这样，即使在海王星被发现之前，万有引力定律象掷骰子出双六那样不大可能，在发现之后它却具有 1000 比 1 的有利情况。

这个论证如果推广到所有观察到的有关行星运动的事实，显然表明如果万有引力定律在最初被人提出来的时候即使具有很小的概率，它不久就几乎成了带有必然性的东西。但是它却丝毫不能帮助我们估计这种最初的概率，因此即使它真，也不能为我们从观察到理论中间所做的理论性质的推理提供稳固可靠的基础。

另外，上面这种论证由于以下的事实也可以受到人们的反对，即万有引力定律并不是使人预料海王星在它原来的地点出现的唯一定律。假定万有引力定律在时间 t 以前一直为真，这里 t 是发现海王星之后的任何一个时刻；那么我将仍然有 q/p’h＝1，这里 p'表示认为这个定律只是到 t 以前一直为真的假设。所以我们有比纯粹机会或者纯粹机会和波得定律加起来更多的理由来预料海王星的发现。这个定律直到那时一直为真这件事已经成为具有很大概然性的事情。推论它在将来有效就需要一个绝不能从数学的概率论中推导出来的原理。这种想法破坏了建设一般理论的归纳论证的全部力量，除非这种论证受到某种类似人们所认为的自然的齐一性的原理的支援。在这里我们又一次看到归纳需要某种超出逻辑范围、不依靠经验的普遍原理的支持。