(五)一元线性回归的预测

若已求得回归方程 y∃=a+b ,则当 x=x0 时,对应的预报对象 y 的点预测值为 y∃0=a+bx 。但是,由于各种因素的影响,在 x=x 时,实际上观察到的数值 y0 一般不会恰好是 y∃0 ,它们之间总是存在着一定的们差,即预测误差。为了掌握预报的精度,要对误差的变动范围作出测定。

通常用估计标准误差来说明 y∃i 与 yi 的差异程度,在大样本时,其公式

为:

Syx =

(5)

此式计算比较繁琐,通常采用下式:

Syx =

(6)

一般若 y 为正态分布,当 n 较大,并且 x0 不远离 x 时,可以证明当 n 较小,通常 n<30 时,则若给定置信概率(即可靠度)1-a,可以证明 y0 的预测区间为:

y∃0

  • t a (n − 2)Syx 2

≤ y0 ≤ y∃0

a

  • t 2 ( n − 2)Sxy

1 1 (x0 − x0 )2

+ n + ∑( x

  • x)2 其中t a 可通过查t分布表得到。

实际上大样本预测区问的公式和小样本预测区问的公式是一致的,因为当 n 增大时,小样本公式中的概式趋近于 1,t 分布趋近于正态分布,在正态分布下,概率度为 1 的置信概率是 0.6287,概率度为 2 的置信概率是 0.9545,概率度为 3 的置信概率是 0.9973。

二、多元线性回归