检验假说的非演绎语言

对于检验统计假设,看来好象至少有三种有效的非演绎语言:

  1. 由萨维奇(1954)和林德利(1965,I 和 II)发展了的贝叶斯方法;

  2. 费舍尔(1956)的频率方法;

  3. 奈伊曼-皮尔逊理论的频率方法。

这三种语言并非相互无关,今人惊奇的是;建立在根本不同的概念之上的这些方法,却具有那么多共同的结果和定理。对这些方法之间的相似和差异的探讨,就形成了统计学中一个研究题目。例如,很明显的是,当证据增加时,在确定后验概率值方面,先验概率的重要性会越来越小,最后,建立在贝叶斯定理上的结论与完全建立在频率概念上的结论,归根到底并无根本的不同。同样,有许多检验在所有语言中都是容许的。主要差异看来在于如何控制所允许的证据。费舍尔(1966,25)强调与允许通过试验学习的检验程序有关的试验设计的逻辑性,并强调基本上都是“迄今自然增长着的进展报告、解释和收录证据”的结论之发展。为了做到这点,费舍尔被引至有争议的置信概率概念。奈伊曼- 皮尔逊理论在其统计检验的方法上要严谨得多,在给出一定假设的情况下,关于数据的性质(长期频率)以及数据中的期望,还作出了相当重要的假设。贝叶斯理论范围非常广泛,但却苦于存在与先验分布的主观选择有关的问题。

因此可以部分地得出结论:“在它们的不同之处,基本原因不是哪一个或哪几个错了,而是它们自觉或不自觉地不是回答不同的问题,就是依据不同的基本原理”(肯达尔和斯图亚特,1967,II,152)。关于统计推断的基础,从近来活跃的辩论中出现的一件事,就是不同语言适合于不同目的和不同情况。与决策和制订政策这种广泛问题有关的那些事,几乎总是诉诸贝叶斯体系,并且从概率的这一概念自然扩展到了如卢斯和雷伐(1957)所提出的决策问题的更一般陈述。另一方面,与在不同肥力状况下作物生产力的经营试验有关的那些问题,将可能借助于费舍尔(1966)所强调的那种方法。因此,虽然在统计学家中,关于一种适宜的非演绎语言之性质尚有争论,这一事实对于那些寻找确凿指导的人似乎会引起混乱,甚至丧失信心。但同时它也有促使我们去评价一定研究的目的和我们的知识环境范围的有益作用。只有当我们明确了目的,我们才能够(i)建立适宜的假设;(ii)为检验它们选取适宜的方法。因此,值得记住丘奇曼(1948,24)的名言:

通过系统阐述我们用来作为可能答案的那些东西,我们才能最好地搞清楚我们提问时所意指的那些东西。换言之,直到一个人能够陈述可能的答案是什么时,问题才会明朗。

所以,大量艰苦的分析思考包括时所提问题性质及提问的目的的研究是

很重要的。先验分析,特别是模糊性的排除,可以解决后来大量概念和解释上的困难。没有这样的先验分析,要避免在采用最复杂的非演绎程序之后还会出现的问题——即究竟研究结果意味着什么?就很困难。我们需要有意识地从几种非演绎语言中选择一种,这就要求搞清楚这种选择的基础。这样的要求,对地理学中的经验性研究只会起到良好作用,这样的工作,当它以经常具有目标的模糊和公式中的模棱两可为特征时,只能从其逻辑性所需要深刻艰苦的分析与思考的情况中受益。但危险在于,没有这样的先验分析与思考,含混的假设将会从与假设几乎或全然无关的数据集中得到高度支持。推断方法总是形成危险,不幸的是我们没有这样的方法就无所作为,因为非演绎推断是证实理论和检验理论的核心。在如此情形中,我们别无选择,只有运用这样的非演绎语言,但这样做时我们应极其谨慎地行事。