主分量分析和因子分析

主分量和因子分析提供了地理学文献中计量分类方法的流行方式。它的重大意义无疑归功于贝里的开拓性工作(1960:1961;1962;1965;1966; 1967B;1968),这一点已为其他很多地理工作者所接受(例如阿赫马德,1965;

凯里,1966,亨歇尔和金,1966:L,金,1966;R. H. T 史密斯,1965B)。另一些人已将这种方法应用于地理学方面(肯达尔,1939;和哈古德,1943 的早期研究尤其重要),这种方法也已广泛地用于类似学科,如心理学(卡特尔,1965)、土壤学(彼得维尔和霍尔,1964)、植物学(古道尔,1954)、地质学(英布里,1963)等等。莫塞尔和斯科特(1961)对英国城镇的研究以及美国城市的研究(哈顿和波格塔,1965)是地理学方面的主要贡献。

因子分析和主分量分析虽然在很多方面相似,但是不能混为一谈。卡特尔(1965,410)已指出:

如果主分量分析的数学目的在语义上与因子分析的试验性目标区别开来,那么就能避免很多把手段和目的混为一谈的混乱和争论。

肯达尔(1957,37)也强调了这种区别:

在主分量分析中,我们从观察开始,并寻找分量,希望或许能够减少变量的维数, 也希望在某些场合给这些分量以某种物理意义。在因子分析中,我们的工作正好相反,这就是说,我们从一个模型开始,并要求看看它是否适合于数据,如果适合,就估计模型的参数。

从分类的观点来看,这种差别相当于没有任何理论的分类(主分量分析

的情况)或有理论的分类(因子分析的情况)。主分量分析和因子分析之间详细的技术性差别无须我们费心,因为可在有关文献中找到充分的说明(卡特尔,1965;库利和洛内斯,1964;肯达尔,1957)。两种方法都直接在数据矩阵上运算,或在属性的(R 方式)或对象的(Q 方式)相关矩阵上运算。考虑各变量相联系的一个相关矩阵,这将是一个 mxm 矩阵。主分量分析相当于该 m 维空间的一个影射,其中,m 个变量载人一个 r 维分量空间(通常 m

=r),这个 r 维分量空间具有如下性质:每一分量维正交于其它任一分量维, 而且第一个分量定义为在基本相关矩阵中抽取了最多方差数的矢量。后续各分量皆正交,且在每一阶段都抽取剩余方差的最大数额。用主分量分析,常常发现开始的几个分量抽取了很大比例的总方差。假设开始的两个分量,从一个 25x25 的矩阵中抽取了方差的 70%,这等于说,两个分量含有 25 种属性中信息的 70%,此外,这两个分量还是相互正交的。从分类的观点看来,这个方法的长处是很明显的。这样就有可能计算 n 个对象如何在各分量上“得分”,分量得分的矩阵形成一个 nXr,矩阵,它把各对象置于一个 r 维欧几里德空间中。然后又有可能在这个矩阵中的信息基础上,将对象加以组合。然而,有趣而应注意的是,主分量分析把各种属性也组合起来,因为通过检查分量装载,各属性本身也可能被组合起来,各种相互关系可更好地加以理解,各属性的某种基本结构可得以确定。在技术上没有必要在作分类以前就解释各属性间的相互关系,但是所企求的分类一般性,将依赖所用分量的稳定性(大概述依赖分量的一般性)。

在因子分析中,很多基本的基础量纲是假设的,而且要在数据矩阵(或在对象、属性间的相关矩阵)中寻找。在这种情况下,就遵循同样的数学步骤,除非最后的矩阵只有 k 个因子(因子的数量由假设决定,并且可能既比m 种属性也比 n 个对象少得多)。此外,某一属性或对象与其自身的相关, 被分解成一个一般部分(称为公因子方差)和一个独特部分(想象为与一般研究无关或是一种随机噪声,或二者兼有)。各因子不必正交(它们可能是非直角的),但要把初始空间变换为一个异常俭省的,已知其结构的空间, 这样才有可能在这一基础上进行分类。

然而,当我们常常对属性或对象的基础结构没有明晰的见解时,关于在地理学里应用因子分析技术是有某种问题的。贝里(1966)在对经济开发作区划时使用了因子分析;因子分析在其它情况下,包括估计一个变量与其本身相关的一般(与独特相对)程度。于是贝里估计了相关矩阵主对角线上的公因子方差(一般相关的程度)。L.金(1966,206)对这种观点持异议,他就城市组合而论,提出“在能有把握地采用这种公因子方差估计以前,看来需要更多地了解城市关系。”