第九章 相关分析

第一节 相关分析的意义

相关分析的意义 在人类社会生活和自然界,许多现象之间都存在着相互联系、相互依存、相互制约的关系。例如,人体身高与体重之间,农作物的产与施肥量之间,劳动生产率与成本和利润之间,商品的价格与销售量之间,等等,都存在着一定的依存关系,而且这种关系都可以通过数量把它们反映出来。如果再进一步加以考察,则可以发现,这些现象之间的相互关系又可区分为两种不同的类型:

一、确定性关系

变之间的确定性关系,就是我们所熟悉的函数关系。这种关系的主要特点是,某一变量发生变化,另一变量就有一个确定的值与之相对应。例如, 圆的面积与半径之间的关系,就可以用一个确定的公式反映出来:

在这里,S 是圆的面积,π是一个常数,约等于 3.1416,R 是圆的半径, 只要 R 的值发生变化以后,就有一个确定的圆面积的值和它相对应。也就是说,圆的面积是随着半径的大小而变动的。

二、相关关系相关关系的主要特征是,某一变量发生变化,另一变量也随之而发生变化,但它们之间的关系值并不是固定的。例如,每亩耕地的施肥量与亩产量之间,存在着一定的依存关系。在一般条件下,施肥量适当增加,亩产量便相应地提高。但是,亩产量与施肥量增长的数值之间,并不存在严格的依存关系。因为,对每亩耕地的产量来说,除了施肥量多少这一因素以外,还受到种子质量、土壤条件、灌溉状况、耕作深度、密植程度、管理情况等其他因素的影响,即使在施肥量相同的条件下,其亩产量也并不完全相同。

但是,相关关系和函数关系也有联系。函数关系是一种理论关系,在实际工作中,由于观察或测量误差等原因,函数关系往往通过相关关系表达出来;而我们在研究相关关系时,又要使用函数关系的形式来表现它,以便找到相关关系的一般数量表现形式。由此可见,相关关系是指现象之间确实存在的、但其关系值不是确定的那么一种相互依存关系。而相关分析则是研究现象之间相关关系的一种数理论统计方法。它可以帮助我们判断现象之间有没有关系,有什么样的关系,密切程度如何,哪些因素是主要的,哪些因素是次要的,一个变量发生变化,另一变量将会发生什么样的变化等等,从而提高人们对于现象之间相互关系的认识。在实际工作中,它广泛应用于经济预测、产品质量控制、因素分析、数据处理以及自然科学研究中一些数学模型的制定等。因此,它是一种很有用的统计分析方法。为了研究问题方便起见,在这里,我们需要搞清楚两个名词。这就是在具有相互依存关系的两个变量之中,作为发生变化根据的那个变量叫做自变量(X),而把发生对应变化的那个变量叫做因变量(Y)。例如:

第九章 相关分析 - 图1

应该指出,有时候,这两个现象是可以互为根据的。例如,身高是体重的根据,也可以体得是身高的根据。在这种情况下,就需要根据研究的目的来确定哪个自变量,哪个是因变量。

相关关系的种类 相关关系,从各个不同角度出发,可以有各种不同的分类方法,这和后面讲的研究方法有关系。现分别阐述如下:

一、单相关和复相关

从相关关系涉及的因素多少来讲,可分为单相关和复相关两种:

(一)单相关。

在研究问题时,只涉及一个自变量和一个因变量,象这种相关关系就叫做单相关。例如,身高和体重,商品的价格和销售量,等等。

(二)复相关

在研究问题时,涉及二个或二个以上的自变量和一个因

变量,象这种相关关系就叫做复相关。例如,同时研究施肥量、浇水量、密植量、耕作深度与亩产量之间的关系,就叫做复相关。在相关关系中,单相关是复相关的基础。只要懂得了单相关,再有了必要的高等数学知识,复相关不难理解的。所以,我们在这里主要向大家介绍单相关。

二、直线相关和曲线相关

从相关亲系的表现形态来讲,可分为直线相关和曲线相关两种:

(一)直线相关。

相关关系是一种数量关系不严格的相互依存关系,如果这种关系近似地表现为一条直线,称为直线相关。

(二)曲线相关。

如果现象间的相关关系近似地表现为一条曲线,称为曲线相关。而曲线相关还有不同的种类,如指数曲线、抛物线、双曲线,等等。一般地讲,在社会经济统计中,直线相关用得比较多一些,所以,我们在这里主要向大家介绍直线相关。

三、正相关和负相关

直线相关按照它所变化的方向来讲,可以为正相关和负相关两种:

(一)正相关。

如果自变量(X)的数值增加,因变量(Y)的数值也相应地增加,这就叫做正相关。例如,身高增加,体重也增加;施肥量增加,亩产量也增长, 等等。(二)负相关

如果自变量(X)的数值增加,因变量(Y)的数值相应地减

少;或自变量(X)数值减少,因变量(Y)数值相应增加,这就叫做负相关。例如,商品销售额扩大,商品流通费用率直线降低;或商品价格降低, 商品销售量直线上升,等等。