因果分析法
1.一元线性回归分析
(1)假设预测对象(y)与主要影响因素(x)之间存在线性关系,则:
y=a+bx+e
(xi,yi)为(x,y)样本中的一组数据,因而也有:
yi=a+bxi+ei
其中:ei为用 a+bxi去估计yi的值而产生的误差。
在实际预测中,ei是无法预测的,忽略ei后可得到预测对象y的估计值。
y=a+bx
n为样本组数;
xi,yi分别为自变量x,因变量y的观察值(实际值)。
对于任何一个观察值xi,都有拟合值(预测值):
yi’=a+bxi
(2)相关检验(方差分析、相关系数检验、 t检验)
对于一元线性回归,这些检验效果是相同,因此,选择一项检验即可。
①方差分析
R2 的大小表明了y的变化可以用x来解释的百分比。
②相关系数检验
相关系数是描述两个变量之间的线性相关关系的密切程度的数量指标,用R表示。
R的绝 对值越接近1,表明其线性关系越好;
在计算出R值后,可以查相关系数检验表。在自由度(n-2)和显著性水平α(一般取α=0.05)下,若 R大于临界值,则变量x和y之间的线性关系成立;否则,两个变量不存在线性关系。
R=0.0 R=0.5 R=0.75
R=0.90 R=0.95 R=1.0
③t检验
通常只检验参数b。
tb 服从t分布,通过查t分布表查得显著水平为α,自由度为n-2 的数值 t(α/2,n-2)。
若 tb的绝 对值>t,表明x和y之间的线性假设成立;若tb的绝 对值≤t,则假设不成立。
(3)点预测与区间预测
上述方法介绍的是如何进行点预测,当求出回归方程后,如果给定自变量x 的未来值x0 后,即可求出:
y0’=a+bx0
现实中,预测的实际值总会与预测的预测值产生或大或小的偏差,那么以一定的概率1-α预测的y在y0’附近变动的范围,称为区间预测。
在小样本统计下(样本组数n<30),置信水平为100(1-α)%的预测区间为:
y0’±t(α/2,n-2)S0
其中,t(α/2,n-2)可以查 t分布表得出,一般取α=0.05。
……
小案例一:
咨询人员最终采用回归分析法进行预测,预测结果是2015年B业务的产品市场需求为3000万台。
检验系数 t(α/2,n-2)=2.04,S0=140
(其中α=0.025,n=30)。
问题:3.根据市场需求预测结果,分析2015年B业务产品需求量的区间及其可能的概率。
参考答案:
该产品需求量的预测区间
=y0 ’±t(α/2,n-2)S0
=3000±2.04×140=3000±285.6
即:2015年B业务产品需求量的预测区间在(2714.4,3285.6)内,其可能的概率为100(1-α)%
=100(1-0.025)%
=97.5%。