二章多元线回归multiplelinearregression.ppt
《二章多元线回归multiplelinearregression.ppt》由会员分享,可在线阅读,更多相关《二章多元线回归multiplelinearregression.ppt(68页珍藏版)》请在三一文库上搜索。
1、第二章 多元线性回归 (multiple linear regression),第一节 相关和回归 第二节 一元线性回归模型 第三节 多元线性回归模型 第四节 方程的解释能力 第五节 回归方程的检验和回归系数的推断统计 第六节 虚拟变量的应用 第七节 多重共线性及其解决方案 第八节 计算机应用 第九节 研究实例,参见郭志刚主编,社会统计分析方法SPSS软件应用第二章, 中国人民大学出版社1999,第一节 相关和回归,一、相关统计量 用一个数值表示两个变量间的相关程度(无单位度量)(-1+1),解读,X与y的相关系数为0.6,x与z的相关系数为0.3,答案: 只能说明x与y相关程度高于x与z的相
2、关程度,但不能说前者是后者的两倍,二、计算相关的思路 定距:数量上的“共变” 定类、定序:“连同发生”隐含根据一个变量去预测或估计另一个变量的意思 人们正是根据预测的准确程度来界定定类或定序变量之间的关系的消减误差比例,三、相关测量逻辑展示 (一)Lambda相关测量法 基本逻辑:以一个定类变项的值来预测另一个定类变项的值时,如果以众值作为预测准则,可以减少多少误差 公式:,练习:根据下表数据计算lambda,思考并运算:如果数据有如下变化,lambda值会发生什么变化呢?,存在的问题: 1、Lambda系数以众值为预测准则,不理会众值以外的次数分布,对数据利用率低。 2、因为上述计算方式,如
3、果全部众值集中在条件次数表的同一列或同一行中,则Lambda系数会等于0,相关失去意义,(二)相关系数r 1、协方差的思想 2、r系数计算 3、PRE计算思路,四、回归,回归是相关分析的深入 回归分析的结果是建立一个数学模型以表达变量之间的关系在分析观测数据的基础上,确定一个能反映变量之间关系的近似函数表达式,线性关联,整体研究方案,1(多)个 定距(类)变量,1个 定距变量,理论思路,经验支撑,方法论指导,注意,回归模型只是整个研究方案中的一环,它必须依赖理论和经验的支撑,服从研究设计的需要,在研究方法论的指导下展开,研究变量间的因果关系,预测,是否吻合预先构想,评价模型拟合度,求解模型参数
4、,估计,第二节 一元线性回归,参见:卢叔华社会统计学,北京大学出版社1997 第十二章 回归与相关,一、回归方程与线性回归方程 二、回归方程的建立与最小二乘法 三、回归方程的假定与检验,一、回归方程与线性回归方程,两变量x与y 对于确定的xi,yi是随机变量,可计算其均值回归方程是研究自变量不同取值时,y的均值的变化 当因变量y的均值与自变量x呈线性规律时,称线性回归方程 根据x个数不同,分为一元线性回归、多元线性回归,关于模型,现实数据=模型+误差 没有误差的不是模型,是复制 复制很精确,但是往往太不简洁 设置模型一般而言是希望用简洁的方式表述复杂信息,达到较好的精确度,二、回归方程的建立与
5、最小二乘法,回归分析的目的:找出错误最小的方法来预测因变量的数值 拟合思路:各点到待估直线铅直距离之和为最小最小二乘,原理: (1)散点图 (2)每个x值对应的y的均值,构成回归线(曲折) (3)用最小平方法绘制回归直线 (各个样本个案的估计误差和为误差总数。为避免正负抵消,改为将误差的平方值相加。如果回归直线位置能够使此平方和最小,即为最佳拟和直线),线性回归方程式不但有简化资料的作用,而且可以推广应用于预测或估计样本以外之个案的数值,回归系数的意义: b值的大小表示每增加一个单位的x值,y值的变化有多大,三、回归方程的假定与检验,(一)基本假定 1、自变量x可以是随机变量,也可以是非随机变
6、量,其误差忽略不计 2、对于每一个x值,yi都是随机变量。Y的所有子总体y1,y2yn,方差相等 3、y的所有子总体,其均值都在一条直线上线性假定 4、随机变量yi是统计独立的 5、 y的所有子总体都满足正态分布,(二)检验 F检验,第三节 多元线性回归模型,一、多元的思路 二、回归方程的建立 三、回归方程的解释 四、标准化回归系数,一、多元的思路,关联性 Association 和因果性Causality 统计意义上的关联性很容易发现 , 难的是,如何确立因果联系。 然而我们在研究中更加关心的是因果性的解释。,因果关系存在的必要条件: 1、变量间的关系是strong and consiste
7、nt; 2、变量间有适当的时序性; 3、变量间的关系不能够被其他变量所解释。,对观察数据的统计控制,我们如何排除其他备选解释? 和实验室的实验不同的是,我们不能控制社会现象发生的环境。 对于观察数据, 因果性问题可以部分地通过统计控制来解决 即, 我们可以把个体根据我们所要控制的特征分成几个小组, 来比较组内的结果变量的差异 对定量变量最常用的统计控制体现在多元回归模型中。,二、回归方程的建立,多元回归模型一般表达式,建立的多元回归方程:,其中, 称y对x的回归系数或偏回归系数 可用最小二乘法求解,多元回归系数的估计,首先看只有两个自变量的模型 : 我们仍可以用最小二乘法,使得观测的Y值和预测
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多元 回归 multiplelinearregression
链接地址:https://www.31doc.com/p-3106358.html