第八章回归分析.ppt
《第八章回归分析.ppt》由会员分享,可在线阅读,更多相关《第八章回归分析.ppt(51页珍藏版)》请在三一文库上搜索。
1、2019/6/15,第八章 回归分析,2019/6/15,操作界面:,应用:在两个或多个相关变量之间,有时需要用一个变量或多个变量估计另一个变量,可进行回归分析。,自变量(x):表示原因的变量 依变量(y):表示结果的变量,2019/6/15,线性回归 Linear 曲线回归 Curve Estimation 二元logistic回归 Binary Logistic 多元logistic回归 Multinomial Logistic 概率单位回归 Probit 非线性回归 Nonlinear 加权回归 Weight Estimation 二阶段最小二乘法 2-stage least Squar
2、es,2019/6/15,1. 一元线性回归分析,计算公式:,线性回归方程可记为:,2019/6/15,例1 在四川白鹅的生产性能研究中,得到如下一组关于雏鹅重(g)与70日龄重(g)的数据,试建立70日龄重(y)与雏鹅重(x)的直线回归方程。,对于线性回归分析,要先做散点图考察数据是否满足线性趋势,有线性趋势再做线性回归分析。,2019/6/15,四川白鹅重与70日龄重测定结果,1.数据输入 以x、y分别代表雏鹅重、70日龄重。 定义两个变量“x”、“y”,小数位(Decimals)依题意都定义为0。 输入数据,2019/6/15,2019/6/15,2.回归分析步骤: AnalyzeReg
3、ressionLinear Dependent框:y 依变量为70日龄重y Independents框:x 自变量为雏鹅重x Statistics: 要求输出变量的基本统计量 Descriptives;Estimates;Model fit Continue OK,系统默认,2019/6/15,分析过程说明 单击Analyze(分析)Regression(回归)Linear(线性)弹出线性回归分析对话框,将“y”置入 Dependent框(依变量),变量x置入Independents框(自变量)。 单击Statistics按钮,选中Descriptives,要求输出两变量的基本统计量(有效例数
4、、平均数、标准差及变量间的相关矩阵), Continue返回,OK,则输出,2019/6/15,Estimates: 可输出回归系数b及其标准差、t值和p值、标准化回归系数; Model fit: 模型拟合过程中进入、推出的变量列表及有关拟合优度的检验; Covariance Matrix 输出各个自变量的相关矩阵和方差、协方差矩阵 Descriptives:提供一些变量描述,如有效例数、均数标准差等同时还给出一个自变量间的相关矩阵。 R squared change:显示模型拟合过程中R2、F值和P值的改变情况。,2019/6/15,3.结果分析 两变量基本统计指标 70日龄重平均数x=27
5、20.83,标准差SD=274.937 雏鹅重平均数x=98.5,标准差SD=12.377,2019/6/15,从表中可以看出: R相当于两个变量的相关系数r,r0.977;R square即R的平方值,为决定系数,r20.955; 校正的决定系数r20.951,表示依变量70日龄重的变异中有95.5%是由自变量雏鹅重的不同造成的;,2019/6/15,估计值的标准误差记为:,Syx的大小表示了回归直线与实测点偏差的程度:Syx大,表示回归方程偏离度大;Syx小,表示回归方程偏离度小,2019/6/15,F=213.808,P=0.0000.01,表明四川白鹅70日龄重与雏鹅重间存在极显著的线
6、性回归关系。,2019/6/15,回归系数b=21.712;截距(常数)a=582.185,可建立回归方程:,2019/6/15,截距的标准误差为147.315,回归系数b的标准误差Sb,为1.485,公式为:,2019/6/15,相关系数为0.977。T值为14.622,P=0.0000.01,即线性回归系数为21.712,是极显著的,表明70日龄重与雏鹅重间存在极显著的线性关系,可用所建立的回归方程来进行预测和控制。,由上两表可以看出:方差分析结果与t检验的结果一致,因而在线性回归分析中,这两种检验方法是等价的。,2019/6/15,2. 多元线性回归分析,多元线性回归用于研究一个依变量与
7、多个自变量间的线性依存关系。,例2 根据下述某猪场25头育肥猪4个胴体性状的数据资料,试进行瘦肉量y对眼肌面积(x1)、腿肉量(x2)、腰肉量(x3)的多元线性回归分析。,为常数项;,为偏回归系数。,一般式为:,2019/6/15,2019/6/15,1.数据输入 定义变量“y”、“x1”、“x2”、“x3”。小数位(Decimals)依题意均为2。在相应的Label(标记)单元格内对各自所代表的内容分别进行标记。输入数据。,2.简明分析步骤: AnalyzeRegressionLinear Dependent框:y 依变量为y Independents框:x1、x2、x3 自变量为x1、x2
8、、x3 Method列表框:Enter 该组变量进入方式为Enter OK,2019/6/15,2019/6/15,2.统计分析 简明分析步骤: AnalyzeRegressionLinear Dependent框:y 依变量为y Independents框:x1,x2,x3 自变量为x1,x2,x3 Method列表框:enter 该组变量进入方式为enter OK,2019/6/15,Enter法:把所有自变量(x1、x2、x3)同时都纳入回归方程,“线性回归分析”主对话框:,2019/6/15,分析过程说明 单击Analyze(分析)Regression(回归)Linear(线性)弹出线
9、性回归分析对话框,将“y”置入 Dependent框(依变量),将自变量x1,x2,x3置入Independents框内,同时使Method(方法)下拉式选择框处于Enter位(通常为SPSS默认方式)。即把所有自变量同时都纳入回归方程。单击OK,则输出下表:,2019/6/15,多元回归方程有很多模型,SPSS会给予指出;本例用了Enter模型,即把所有自变量(x1、x2、x3)同时都纳入回归方程,3.结果说明,引入多元回归方程变量的方式,2019/6/15,此表是复相关系数(R)的有关指标,表示自变量与依变量关系的密切程度以及抽样误差。,瘦肉量与有关变量的复相关关系,2019/6/15,此
10、表说明偏回归系数的抽样误差大小,即检测其是否具有统计学意义。F=37.154,P0.0000.01,表明猪瘦肉量y与眼肌面积x1、腿肉量x2、腰肉量x3的综合线性影响是极显著的。,偏回归系数的方差分析(F检验),2019/6/15,各变量偏回归系数及其检验,上表表示多元回归方程的常数项、各自变量的偏回归系数及它们抽样误差的大小,并对各自的抽样误差作假设检验(t检验)。 因此可建立多元回归方程:,2019/6/15,y=0.857+0.019x1+2.073x2+1.938x3 但从表中看,偏回归系数b1 (眼肌面积)、b2 (腿肉量)、b3 (腰肉量)相应的t值和显著性概率分别为: tb10.
11、632,Pb10.5340.05; tb2=7.673, Pb2=0.0000.01; tb3=3.775, Pb3=0.0010.01。 所以偏回归系数b1不显著,而偏回归系数b2、b3极显著,说明眼肌面积对瘦肉量的影响不显著,因而该回归方程不是最优方程。 关于此问题下面讨论。,2019/6/15,3. 逐步回归分析,在多元线性回归方程中,若有一个或几个偏回归系数不显著时,说明其对应的自变量对依变量的作用不显著,或说其在回归方程中不重要,此时应从回归方程中剔除一个不显著的偏回归系数对应的自变量,重新建立多元线性回归方程,再对新方程作新的显著性检验,直至多元线性回归方程显著,且各个偏回归系数都
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第八 章回 分析
链接地址:https://www.31doc.com/p-2969053.html