SPSS如何进行线性回归分析操作.doc
《SPSS如何进行线性回归分析操作.doc》由会员分享,可在线阅读,更多相关《SPSS如何进行线性回归分析操作.doc(45页珍藏版)》请在三一文库上搜索。
1、SPSS如何进行线性回归分析操作本节内容主要介绍如何确定并建立线性回归方程。包括只有一个自变量的一元线性回归和和含有多个自变量的多元线性回归。为了确保所建立的回归方程符合线性标准,在进行回归分析之前,我们往往需要对因变量与自变量进行线性检验。也就是类似于相关分析一章中讲过的借助于散点图对变量间的关系进行粗略的线性检验,这里不再重复。另外,通过散点图还可以发现数据中的奇异值,对散点图中表示的可能的奇异值需要认真检查这一数据的合理性。一、一元线性回归分析用SPSS进行回归分析,实例操作如下:1. 单击主菜单Analyze / Regression / Linear,进入设置对话框如图7-9所示。从
2、左边变量表列中把因变量y选入到因变量(Dependent)框中,把自变量x选入到自变量(Independent)框中。在方法即Method一项上请注意保持系统默认的选项Enter,选择该项表示要求系统在建立回归方程时把所选中的全部自变量都保留在方程中。所以该方法可命名为强制进入法(在多元回归分析中再具体介绍这一选项的应用)。具体如下图所示:2. 请单击Statistics按钮,可以选择需要输出的一些统计量。如Regression Coefficients(回归系数)中的Estimates,可以输出回归系数及相关统计量,包括回归系数B、标准误、标准化回归系数BETA、T值及显著性水平等。Mode
3、l fit项可输出相关系数R,测定系数R2,调整系数、估计标准误及方差分析表。上述两项为默认选项,请注意保持选中。设置如图7-10所示。设置完成后点击Continue返回主对话框。 回归方程建立后,除了需要对方程的显著性进行检验外,还需要检验所建立的方程是否违反回归分析的假定,为此需进行多项残差分析。由于此部分内容较复杂而且理论性较强,所以不在此详细介绍,读者如有兴趣,可参阅有关资料。3. 用户在进行回归分析时,还可以选择是否输出方程常数。单击Options按钮,打开它的对话框,可以看到中间有一项Include constant in equation可选项。选中该项可输出对常数的检验。在Op
4、tions对话框中,还可以定义处理缺失值的方法和设置多元逐步回归中变量进入和排除方程的准则,这里我们采用系统的默认设置,如图7-11所示。设置完成后点击Continue返回主对话框。4. 在主对话框点击OK得到程序运行结果。如题。我选择的是线性回归,得出了一堆表格和图标。我做的是生物学方面的统计。我的目标是得出模拟方程,再根据已有的自变量来计算因变量。我是spss新手,而且我对逐步回归也不了解。但由于工作原因,必须得到模拟方程。请高手告诉我我的这个统计符不符合线性关系,如果符合,怎么写模拟方程,谢谢!以下是部分截图。分享到:2013-11-16 19:52提问者采纳x1,x2.x5是5个自变量
5、,1个y因变量。系数a图中是将x1与y建立一个线性回归模型,常量为1.956E-6,sig. 也即P值=1 0.05,无统计学意义,x1的斜率为-0.504,P=0.0000.05也就说明这个变量对模型的建立无统计学意义,在多元线性回归中也就可以无情的剔除掉。而由系数a图可知,x1, x2,x3,x4,x5的斜率P值都是0.0000.05无显著性意义,说明拟合的线过原点,也即常量值应为0,但是否能改为0这个我也不确定,但0或0.002差别不会太大的。追问厉害,一看就是高手。不好意思,系数那个表里缺一块,我现在补上,再把另外几个表补上。还有点问题想请指教。1.你说的那个常量为1.965E-6,这
6、个E是什么意思?2.自变量一共有6个,从x1到x6,可能是我那个表缺一块的原因吧,抱歉了。系数表缺的部分:其它表:能否将最终的模拟方程式写出来,不胜感激!回答1.965E-6是指1.965乘10的-6次方。已排除的变量表对应系数a表,模型1对应模型1,也即前一个表是进入,相对的后一个就排除。模型1进入了x1,排除的x2,x3,x4,x5,x6中的x2的P值0.05可以去掉,各变量的斜率选用模型6的标准系数。因而最终回归方程为:y=-0.860x1-0.713x2-0.567x3-0.414x4-0.254x5-0.130x6回归分析是处理两个及两个以上变量间线性依存关系的统计方法。在医学领域中
7、,此类问题很普遍,如人头发中某种金属元素的含量与血液中该元素的含量有关系,人的体表面积与身高、体重有关系;等等。回归分析就是用于说明这种依存变化的数学关系。第一节Linear过程8.1.1主要功能调用此过程可完成二元或多元的线性回归分析。在多元线性回归分析中,用户还可根据需要,选用不同筛选自变量的方法(如:逐步法、向前法、向后法,等)。8.1.2实例操作例8.1某医师测得10名3岁儿童的身高(cm)、体重(kg)和体表面积(cm2)资料如下。试用多元回归方法确定以身高、体重为自变量,体表面积为应变量的回归方程。儿童编号体表面积(Y)身高(X1)体重(X2)123456789105.3825.2
8、995.3585.2925.6026.0145.8306.1026.0756.41188.087.688.589.087.789.588.890.490.691.211.011.812.012.313.113.714.414.915.216.08.1.2.1数据准备激活数据管理窗口,定义变量名:体表面积为Y,保留3位小数;身高、体重分别为X1、X2,1位小数。输入原始数据,结果如图8.1所示。图8.1原始数据的输入8.1.2.2统计分析激活Statistics菜单选Regression中的Linear.项,弹出Linear Regression对话框(如图8.2示)。从对话框左侧的变量列表中选
9、y,点击钮使之进入Dependent框,选x1、x2,点击钮使之进入Indepentdent(s)框;在Method处下拉菜单,共有5个选项:Enter(全部入选法)、Stepwise(逐步法)、Remove(强制剔除法)、Backward(向后法)、Forward(向前法)。本例选用Enter法。点击OK钮即完成分析。用户还可点击Statistics.钮选择是否作变量的描述性统计、回归方程应变量的可信区间估计等分析;点击Plots.钮选择是否作变量分布图(本例要求对标准化Y预测值作变量分布图);点击Save.钮选择对回归分析的有关结果是否作保存(本例要求对根据所确定的回归方程求得的未校正Y预
10、测值和标准化Y预测值作保存);点击Options.钮选择变量入选与剔除的、值和缺失值的处理方法。8.1.2.3结果解释在结果输出窗口中将看到如下统计数据:* * * *M U L T I P L ER E G R E S S I O N* * * *Listwise Deletion of Missing DataEquation Number 1Dependent Variable.YBlock Number1.Method:EnterX1X2Variable(s) Entered on Step Number1.X22.X1Multiple R.94964R Square.90181Adj
11、usted R Square.87376Standard Error.14335Analysis of VarianceDFSum of SquaresMean SquareRegression21.32104.66052Residual7.14384.02055F =32.14499Signif F =.0003- Variables in the Equation -VariableBSE BBetaTSig TX1.068701.074768.215256.919.3887X2.183756.056816.7576603.234.0144(Constant)-2.8564766.0177
12、76-.475.6495End Block Number1All requested variables entered.结果显示,本例以X1、X2为自变量,Y为应变量,采用全部入选法建立回归方程。回归方程的复相关系数为0.94964,决定系数(即r2)为0.90181,经方差分析,F=34.14499,P=0.0003,回归方程有效。回归方程为Y=0.0687101X1+0.183756X2-2.856476。本例要求按所建立的回归方程计算Y预测值和标准化Y预测值(所谓标准化Y预测值是指将根据回归方程求得的Y预测值转化成按均数为0、标准差为1的标准正态分布的Y值)并将计算结果保存入原数据库。
13、系统将原始的X1、X2值代入方程求Y值预测值(即库中pre_1栏)和标准化Y预测值(即库中zpr_1栏),详见图8.3。图8.3计算结果的保存本例还要求对标准化Y预测值作变量分布图,系统将绘制的统计图送向Chart Carousel窗口,双击该窗口可见下图显示结果。图8.4对标准化Y预测值所作的正态分布图第二节Curve Estimation过程8.2.1主要功能调用此过程可完成下列有关曲线拟合的功能:1、Linear:拟合直线方程(实际上与Linear过程的二元直线回归相同,即Y = b0+ b1X);2、Quadratic:拟合二次方程(Y = b0+ b1X+b2X2);3、Compou
14、nd:拟合复合曲线模型(Y = b0b1X);4、Growth:拟合等比级数曲线模型(Y = e(b0+b1X));5、Logarithmic:拟合对数方程(Y = b0+b1lnX)6、Cubic:拟合三次方程(Y = b0+ b1X+b2X2+b3X3);7、S:拟合S形曲线(Y = e(b0+b1/X));8、Exponential:拟合指数方程(Y = b0eb1X);9、Inverse:数据按Y = b0+b1/X进行变换;10、Power:拟合乘幂曲线模型(Y = b0Xb1);11、Logistic:拟合Logistic曲线模型(Y = 1/(1/u + b0b1X)。8.2.2
15、实例操作例8.2某地1963年调查得儿童年龄(岁)X与锡克试验阴性率(%)Y的资料如下,试拟合对数曲线。年龄(岁)X锡克试验阴性率(%)Y123456757.176.090.993.096.795.696.28.2.2.1数据准备激活数据管理窗口,定义变量名:锡克试验阴性率为Y,年龄为X,输入原始数据。8.2.2.2统计分析激活Statistics菜单选Regression中的Curve Estimation.项,弹出Curve Estimation对话框(如图8.5示)。从对话框左侧的变量列表中选y,点击钮使之进入Dependent框,选x,点击钮使之进入Indepentdent(s)框;在
16、Model框内选择所需的曲线模型,本例选择Logarithmic模型(即对数曲线);选Plot models项要求绘制曲线拟合图;点击Save.钮,弹出Curve Estimation:Save对话框,选择Predicted value项,要求在原始数据库中保存根据对数方程求出的Y预测值,点击Continue钮返回Curve Estimation对话框,再点击OK钮即可。8.2.2.3结果解释在结果输出窗口中将看到如下统计数据:ndependent:XDependentMthRsqd.f.FSigfb0b1YLOG.913552.32.00161.325920.6704在以X为自变量、Y为应变
17、量,采用对数曲线拟合方法建立的方程,决定系数R2=0.913(接近于1),作拟合优度检验,方差分析表明:F=52.32,P=0.001,拟合度很好,对数方程为:Y=61.3259+20.6704lnX。本例要求绘制曲线拟合图,结果如图8.6所示。图8.6对数曲线拟合情形根据方程Y=61.3259+20.6704lnX,将原始数据X值代入,求得Y预测值(变量名为fit_1)存入数据库中,参见图8.7。图8.7计算结果的保存第三节Logistic过程8.3.1主要功能调用此过程可完成Logistic回归的运算。所谓Logistic回归,是指应变量为二级计分或二类评定的回归分析,这在医学研究中经常遇
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- SPSS 如何 进行 线性 回归 分析 操作
链接地址:https://www.31doc.com/p-3313021.html