概率运算和非演绎推断——特别是统计推断

非演绎推断问题——或如通常所称的归纳问题——已被视为理性科学研究中逻辑性强的方法,它的发展已成为突出问题之一。概率论的应用之一, 是构建适于进行合理的和客观的非演绎推断的语言。卡纳普(1950,207)划分出归纳推理的五种形式:

  1. 从总体(定义为特定研究所涉及的所有个体的类群)到样本(总体的子集,用枚举法确定)的直接推断。

  2. “从一个样本到另一个样本而不重迭前一个”的预测性推断。

  3. “在其相似性已知的基础上,从一个体到另一个体”的类比推断。

  4. “从样本到总体”的逆推断。

  5. “从样本到全域假说”的全域推断。在这一情形中,区分总体和全域是很重要的。一个特定总体可能是全域的一部分。例如我们可以把一处河滩上的卵石,看作是我们从中抽样的总体,而全域则由各处的所有卵石组成。由于在严格意义上定律,被假定为是全域的表述,所以最后这种推断形式是科学哲学家最关心的,但卡纳普指出,事实上,它在理论和实践上的重要性, 比预测性推断的重要性都小。

于是,问题在于,为在所有或某些上述情况中进行归纳推断提供一种恰当的语言。这里,概率论为这样的语言提供了句法,但在这种情况下,不可

能没有语义解释就拿来运用,因为正解决的问题要特别参照经验上可鉴定的情况。在把适于归纳推断的语言形式化的过程中,科学家们必须不但在通用句法、而且在通用解释上都要一致。阿克曼(1966,36—7)将问题陈述如下:

直观想法就是从通过表达包括在一种确定语言中的各种表述着手,然后计算当证据中包含的表述假定为真时,假说或预言表述为真的概率⋯⋯。如果两个人对其中非演绎问题应被形式化的适当语言意见不一致,他们就会计算出不同的概率,但他们的结果将不能仅根据这些概率来比较,因为概率会是它们被计算的语言的函数。为了将概率的概念应用于非演绎问题,在问题形式化上必须一致运用一种选择的和明确的语言。

在数学家、统计学家和哲学家之间,关于这样的语言应为何物没有完全

一致的看法,关于一种特定语言可以应用于何种非演绎推断也无完全统一的看法。这些分歧不是不正常的,它们反映了对概率本身的解释的差异。这里就有一个重要例子(见前文,第 51—3、74—5 页),它说明了将伦理上中立的决策语言形式化的困难,并极出色地阐明了“符合规则”的行为,对于我们理解科学知识的性质是多么重要。因此,有若干种适用于将非演绎推断形式化的不同语言,至于采用哪种语言,则取决于特定的科学家所赞同的特定的思想流派(或如 T. 库恩(1962)所称的范式)。可行的语言可以是从卡纳普(1950)的逻辑构造,经过一系列属于概率的频率解释的语言,例如 R.

A. 费舍尔提出的统计推断理论,奈伊曼- 皮尔逊理论以及瓦尔德的序列分析,一直到萨维奇和林德利那样的统计学家的坦率的贝叶斯(主观)方法。这里不可能研讨所有这些提到的语言,因此读者可以参考由象阿克曼

(1966)、哈金(1965)和普莱克特(1966)这些作者提供的一般讨论。但有关这些非演绎语言的发展及应用的若干一般观点,需要进行一些研讨。

在非演绎推断中有两个经典问题。第一个是参数的估计,它有助于将抽象的定理转化为经验上可用于预测和解释事件的方程。如果为在经验上应用而要将一个模型或理论标准化,则估计参数是基础(劳里,1965)。第二个问题是对感性资料的假设检验。设计假设检验是要说明:检验观测时将一定的理论公式化;当给定现实世界的解释时(可能涉及参数估计),是否在某种意义上比另一种理论的公式化“更好”。这一步骤具有一些困难,或许值得对其中一些进行详尽探讨。