莱新巴哈的理论

莱新巴哈的概率论的特点在于归纳就包含在概率的定义之中。这个理论有如下述(略加简化):

已知一个统计上的系列——例如生死统计上的系列——并且已知包含该系列中某些分子的部分重合的两个类 a 和 B,我们常常发现当项目数大时,a 的分子为 B 的分子的百分数大体上保持不变。假定当项目超过了比方说 10, 000 时,人们发现记录下来的 a 为 B 的比例永远不能大大超过或不及 m/n, 并且这个有理分式比任何其它分式都更加接近平均观察到的比例。这样我们就“假定”不管这个系列怎样扩展,比例将永远接近 M/n。我们把一个 a 为一个 B 的概率定义为在观察次数无限增加时观察到的频率的极限,借着我们的“假定”,我们认为这个极限是存在的并且就在 m/n 的邻域中,这里 m/n 是可能得到的最大实例中所观察到的频率。

莱新巴哈明确断言任何命题都不带必然性;所有命题都只具有不同程度的概然性,并且每个概率都是一个频率的极限。他承认,根据这种理论,计算频率所用的那些项目本身也只具有概然性。拿死亡率作例来看:当我们判

断一个人死了之后,他可能仍然活着;因此死亡统计中每一项都是可以怀疑的。根据定义,这就表示一次死亡的记录一定是一系列记录当中的一个,而这个系列中有些记录是正确的,有些则是错误的。但是那些我们认为正确的记录也只具有概然的正确性,并且必定是某种新的系列的分子。这一切他都承认,但是他说到了某个阶段我们就结束了这种无止境的后退,而采取一种他所谓的“盲目假定”①。一个“盲目假定”是认某个命题为真的一次决定, 尽管我们并没有这样做的充分理由。

在这个理论中有两种“盲目的假定”,也就是:(1)在这个统计系列中我们选取当作基本项目的那些最终项目;(2)认为在有限次数的观察中发现的频率,不管观察次数怎样增加,大体上会保持不变的那个假定。莱新巴哈认为他的理论是完全属于经验范围的,因为他并不断言他的“假定”为真。我现在并不是要研究莱新巴哈的一般理论,这种理论已经在前面一章里

谈论过。我现在要研究的只是他关于归纳的理论。他的理论的要点是:如果他的归纳假定为真,那么预测就是可能的,否则预测就是不可能的。因此我们唯一能够得到支持一种预测而不是另一种预测的概率的途径就是设想他的假定为真。我并不是想否认要得到支持预测的概率就需要某种假定,我想否认的是所需要的那种假定就是莱新巴哈的假定。

他的假定是:已知 a 和 B 两个类,并且已知 a 的实例是按照时间顺序排好的,如果我们在观察了充分数目的 a 之后,发现 a 为 B 的比大体上永远是m/n,那么不管以后可能观察到多少个 a 的实例,这个比例将仍然继续保持下去。

我们首先看到这个假定仅仅在表面上比那个应用到所有观察到的 a 都是B 的情况上的假定具有更大的普遍性。因为在莱新巴哈的假设中由 a 组成的系列的每一段落都具有大约 M/n 的分子为 B 的性质,并且我们可以把那个比较狭义的假定应用到这些段落上去。因此我们可以只研究那个比较狭义的假定。

因此莱新巴哈的假定和下面的话意义相同:在我们观察了大量的 a,并且发现所有的 a 都是 B 之后,我们就将假定所有的 a 几乎可以都是 B。这个假定对于概率的定义,以及一切科学预测来说都是必要的(他这样认为)。我认为这个假定可以证明是错误的。假定 a1,a2,⋯⋯an 是已经观察过

并且发现是属于某一类 B 的 a 的分子。假定 an+1 是要观察到的下一个 a。如果它是一个 B,那么把不包括 an+1 在内的由 B 组成的类来代替 B。对于这个类来说,这种归纳就无能为力。这种论证显然还可以推广。由此可以看出, 如果要让归纳具有正确有效的机会,a 和 B 就不能是任意的类,而必须是具有某些性质或关系的类。我的意思并不是说 X 和 B 之间存在着一种适当关系时归纳就一定正确有效,我只是说在这种情况下归纳可能正确有效,而就它的一般形式来讲,它却可以证明是错误的。

a 和 B 一定不是可以叫作“制造出来”的类,这一点似乎是明显的。我想把上面出现的不包括 an+1 在内的 B 叫作一个“制造出来”的类。广义来讲, 我所说的一个“制造出来”的类是一个通过说出某某一项是或不是它的一个分子而得出至少是它的一部分定义的。这样,“人类”就不是一个制造出来

① 《经验与预测》,第 401 页。

的类,但是“不包括苏格拉底在内的全部人类”却是一个制造出来的类。如果以 a1,a2,⋯an+1 是 a 的最先观察到的 n+1 个分子,那么 a1,a2,⋯⋯an 就具有不是 an+1 的性质,但是我们一定不能用归纳的方法推论出 an 十 1 具有这种性质,不管 n 可能有多么大。a 和 B 这些类必须通过内包,而不是通过说出它们的分子来得到定义。任何为归纳提供合理根据的关系一定是一种概念的关系,并且由于不同的概念可能给同一个类下定义,所以可能出现一对在归纳上相关并分别替 a 和 B 下定义的概念,而另外一些成对的概念虽然也替 a 和 B 下定义,在归纳上却不相关。例如,我们可以根据经验推论出无羽毛的两足动物是有死的,但却不能推论出地球上居住的理性动物是有死的, 尽管存在着这两个概念碰巧替同一个类下定义这件事实。

数理逻辑就它迄今为止的发展来看,是以尽可能做到外延的处理为其目的的。也许这是一个多少带有偶然性的特点,来自算术对于逻辑学家的思想和意图所产生的影响。与此相反,归纳的问题却要求做到内包的处理。固然在一个归纳推论中出现的 a 和 B 这些类,就观察到的实例 a1,a2,⋯⋯an 来讲,是以外延方式表达出来的,但是超过了这一点,重要的却是这两个类直到现在只以内包方式表达出来。举例来说,a 可能是血液中有某些杆状菌的那一类人,而 B 则可能是出现某些症状的那一类人。归纳的最重要的性质就是人们事先并不知道这两个类的外延。在实际应用上,我们认为某些归纳值得证实,而另外一些归纳则不值得证实,我们还似乎受着一种对于很可能具有联系的那些种类的内包的觉察力的引导。

因此莱新巴哈的归纳假定不仅过于广泛而且还太偏重外延。如果莱新巴哈的假定不想成为可以证明是错误的东西,我们就需要有某种范围较窄和偏重内包的假定。

我们对于莱新巴哈关于不同等级频率的理论还要谈论一下,这些不同等级频率最后导致一组“盲目假定”的概率。这是和他认为在逻辑中应该用概卒来代替真理的学说分不开的。让我们通过一个实例来看这个理论,比方说一个六十岁的英国人在一年内死去的机会。

第一阶段是简单明白的:把文件上的记载当作完全正确的东西,然后以总人数去除去年死去的人数。但是我们现在记得统计中每一个项目都可能是错误的。为了计算这个概率,我们必须得到某组经过仔细研究的类似的统计, 并且发现其中所含错误的百分比。我们还记得那些认为他们发现错误的也可能弄错,于是我们就开始去统计关于错误的错误。在这种后退的某一阶段我们势必停顿下来;不管我们在什么地方停顿下来,我们习惯上总会给它一种“分量”,这种分量人们认为大概不是必然性就是我们猜想在后退的下一阶段会出现的那种概率。

作为一种认识论来看,这种方法有着许多可以反对的理由。

首先,在后退中靠后的阶段通常比靠前的阶段要困难和不确定得多;我们不大可能,比方说,在对于官方统计的错误所作的估计上,达到官方统计本身所达到的正确性。

其次,那些我们必须当作出发点的盲目假定是一种想使心灵与肉体两个世界取得调和的努力:盲目假定要完成的任务就是数据在我的体系中所要完成的任务,数据可能是错误的,但是莱新巴哈想通过把它们叫作“假定”而逃避开认它们为“真”所承担的责任。在选择一个假定而不是另一个假定的

时候,除了他认为这个假 416 定更有可能为“真”以外,我看不出还有什么别的理由;并且因为,照他自己的话来讲,这并不表示(当我们处在盲目假定这个阶段时)存在着使这个假定具有概然性的某种已知的频率,所以他才不得不凭借频率以外的某种其它标准来挑选假设。他并没有告诉我们这可能是什么东西,因为他并没有觉察出它的必要性。

第三,如果我们为了结束无止境的后退而抛弃盲目假定完全属于实用方面的需要,并且从纯粹理论方面观察莱新巴哈的概率可能表示的意思,我们就会感到自己陷进了难以解决的复杂情况之中。在第一等级,我们说一个 a 将为一个 B 的概率是 m1/n1;在第二等级,我们对于这个陈述给予概率 m2/n2, 这是通过使这个陈述作为某一系列类似陈述当中的一个陈述而得到的;在第三等级,我们对于认为有一个概率 m2/n2 支持我们的第一个概率 m1/n1 的那个陈述给予概率 m3/n3;这样一直继续下去。如果我们能够完成这种无止境的后退的话,那么支持我们最初估计 m1/n1 的最后的概率会是一个无限乘积

m2 ⋅ m3 ⋅ m 4

n2 n3 n 4

而我们可以预料这个乘积为零。因此看来在选择第一等级上概然性最大的估计时,我们几乎肯定是会错的;但是一般来说这仍然是我们可以得到的最精确的估计。在“概然的”定义中就存在的这种无止境的后退是今人难以接受的。如果我们想避免这种无止境的后退,我们就必须承认我们原来统计中每个项目不是真便是伪,并且承认我们得到的第一个概率的值 m1/n1 不是对便是错;事实上我们对于概然性判断必须和对其它判断一样完全使用真— 或—伪这种二分法。详尽来讲,莱新巴哈的立场有如下述:

有一个命题 p1,比方说“这个 a 是一个 B”。有一个命题 P2,说 p1 具有概率 x1。

有一个命题 p3,说 P2 具有概率 X2。有一个命题 p4,说 p3 具有概率 x3。

这个系列是无尽止的,并且导致(人们要这样认为)一个极限命题,只有对这个命题我们才有权力加以肯定。但是我却看不出怎样才能把这个极限命题表达出来。困难在于:就这个系列中所有先于 417 它的分子来说,根据莱新巴哈的原理,我们没有理由认为它们为真的可能性比为伪的可能性大;事实上它们并不具有我们可以估计的概率。

我的结论是:想不用“真”和“伪”这些概念的努力是个失败,并且概然性的判断和其它判断并没有本质上的不同,而是同样包含在完全的真—伪二分法的范围之内。