第九章隐变量模型.ppt
《第九章隐变量模型.ppt》由会员分享,可在线阅读,更多相关《第九章隐变量模型.ppt(105页珍藏版)》请在三一文库上搜索。
1、第九章 隐变量模型,关于隐变量,隐变量(Latent variable): 具有不可直接观测特征的综合性变量,不可观测,或者说“隐”是其表象;综合性是其本质。 与隐变量相应,我们将普通的变量称为显变量(Manifest Variable)或者观测变量(Observed Variable),隐变量的处理思路,隐变量的处理方法按照其所使用的分析手段可以分为两大类: 以结构方程模型为代表的模型化方法 以多指标综合加权为代表的不使用模型的方法。,不使用模型处理隐变量的方法,除结构方程模型外的其它处理方法可分成两类: 第一类方法利用隐变量的多维特点,从各个角度选择恰当的观测变量作为其测度指标,以此作为隐
2、变量处理的基础,目前来看所有具有一般性的隐变量处理方法,其思想均属此类;,不使用模型处理隐变量的方法,第二类方法则利用隐变量和其它变量(不是该隐变量的测度变量)之间的关系,建立某种函数关系,以此为处理隐变量的基础,它不需要搜集隐变量测度指标这一过程。此类方法只能处理特殊的隐变量,不具一般性。,不使用模型处理隐变量的方法,1、多指标综合评价法 根据隐变量的含义,将原本综合性的变量进行分解,分解后隐变量的维度就从一维到了多维,在此基础上,在每个维度选择合适的观测变量度量隐变量在该方面的表现,最后再将这些观测变量按一定的原则加权汇总,由多维又重新回到一维,所得同时反映这多维表现的综合变量即可做为对隐
3、变量的度量。,不使用模型处理隐变量的方法,多指标综合评价的关键环节有二: 第一个环节是测度指标的选择; 第二个环节是权数的确定。,不使用模型处理隐变量的方法,多指标综合加权法的长处: 1)思路直观、方法简便、适用面广; 2)可容纳指标数量较多,更适合理论的需要; 3)可以对样本进行比较、排序,而且便于对隐变量进一步的分析; 4)不依赖于变量的分布。,不使用模型处理隐变量的方法,此种方法的不足之处则在于: 1)用以构建综合变量的观测变量,往往受多种因素的影响,有时甚至作为测度对象的隐变量不是主要的影响因素,因此最终得到的隐变量的估计值,必定存在着系统的偏差; 2)加权所使用的权数难以确定 ; 3
4、)不能提供对误差的度量,从而无法估计所建立的隐变量测度的准确性。,不使用模型处理隐变量的方法,2、德尔菲法 又名专家调查法,它的思想十分简单,即以专家判断的方式对隐变量进行量化。 德尔菲法与多指标加权方法相比,其优势在于它更适合于那些很难找到合适指标作为其测度的隐变量;其不足则在于:1)需要进行调查,从而提高了分析的成本;2)不能对隐变量进行深入进一步的分析;3)降低了数据的计量尺度。,不使用模型处理隐变量的方法,3、生产函数余值法 根据CD生产函数可以推出,经济增长率等于要素生产率的变化率(即技术进步率)加上资本增长率与资本边际产出弹性之乘积,再加上劳动增长率与劳动边际产出弹性之乘积。以经济
5、增长率减去其它两部分,就得到要素生产率这个隐变量的变化率,将它比上经济增长率就可得到贡献率。,结构方程模型,结构方程模型:SEM,(Structural Equation Modeling),是目前处理隐变量以及复杂关联的主要模型。,主要内容:,结构方程模型的形成 模型的设定 模型的识别 模型的假定 模型的估计 模型的评价 模型的改进 模型的解释 应用案例,一、结构方程模型的形成,结构方程模型有两个思想来源: 路径分析(path analysis) 证实性因子分析(Confirmatory Factor Analysis,CFA ) (注意:通常所说因子分析是探索性因子分析,Explorato
6、ry Factor Analysis,EFA),一、结构方程模型的形成,路径分析 在20世纪二三十年代,由 Wright(1921,1934)提出,与古典的多元线性回归模型相比,路径分析是一种更为灵活、有力的多元数据分析工具。,一、结构方程模型的形成,路径分析与线性回归分析最根本的区别在于: 路径分析中,所有的变量都是随机变量,从而所有的变量之间都可以有相关关系。这毫无疑问是更接近于现实的假设,尤其在社会经济领域。,一、结构方程模型的形成,路径分析与一般线性模型不同的特色主要体现在如下四个方面: 1、变量之间的关系必须先根据理论予以设定; 2、以路径图做为描述模型的重要工具; 3、将参数估计建
7、立在变量的相关系数或协方差的基础上; 4、将简单相关系数分解为直接相关系数,间接相关系数。,一、结构方程模型的形成,证实性因子分析 CFA与EFA的根本区别在于是前者用以证实一个先验的理论假设(表现为因子结构的规定)是否成立,需根据相关理论事先规定作为公因子的隐变量的概念和数量,以及隐变量和指标变量间的路径,后者则以探索数据潜在的结构为目标,事先无须依据理论做任何设定,隐变量的概念和数量以及哪些变量是其指标变量均有待模型建立后,再根据理论知识予以确定。,一、结构方程模型的形成,无论是CFA还是EFA,都以隐变量(即潜在结构)为核心,以显变量为其测度,认为这些测度变量是隐变量的外在表现,由隐变量
8、所决定,因此可以利用测度变量之间的关系推出其与内在隐变量的联系,即因子载荷,这正是SEM处理隐变量的思想。,一、结构方程模型的形成,将CFA与路径分析结合在一起就是SEM技术。这两种方法的结合,可以理解为: 将CFA作为对隐变量的测量,嫁接到路径分析上,从而使路径分析具有了包含、处理隐变量的能力。,一、结构方程模型的形成,从SEM的角度来看,CFA和路径分析都可以视为一种特殊的结构方程模型,它们都是SEM的一部分,即: 路径分析构成SEM的结构模型部分;CFA构成它的测量模型部分。,一、结构方程模型的形成,SEM的优势: 能处理隐变量问题 可以处理复杂关联 可以处理随机误差相关问题 可包含测量
9、误差,二、结构方程模型的设定,基本概念 方程: 分为测量方程与结构方程。测量方程反映显变量和隐变量之间的联系,结构方程反映隐变量之间的关系,二、结构方程模型的设定,变量: 隐变量和显变量(又名指标变量、观测变量),进一步又分成: 外生隐变量:由模型以外因素决定; 内生隐变量:由模型内因素决定; 内生指标变量:作为内生隐变量的测度指标; 外生指标变量:作为外生隐变量的测度指标。,二、结构方程模型的设定,误差项 模型内有两类误差: 测量误差:内生、外生指标变量在测量隐变量上的误差; 结构方程误差:影响内生隐变量的误差。,二、结构方程模型的设定,参数: 限制参数(restricted paramet
10、ers): 限制其取值范围的参数; 固定参数(fixed parameters): 设定为常数的参数; 自由参数(free parameters): 不加任何设定由模型进行估计的参数。,二、结构方程模型的设定,模型设定的RAM图形式(Reticular Action Modeling) 根据理论分析绘制RAM图,是结构方程模型建模的起点,也是表达建模结果的最有效形式。,二、结构方程模型的设定,RAM图基本规定 1.变量用大写英文或希腊字母表示,其外围围以方框的是显变量,其外围围以椭圆的是隐变量。残差以小写希腊字母表示,外围亦应围以椭圆(但为方便起见,经常不用);,二、结构方程模型的设定,2.路
11、径用带箭头的线表示: 直的单方向箭头:表示因果关系,箭头所指为果; 双向箭头弧线:表示相关关系; 从自身到自身的双向箭头线:表示变量的方差。,二、结构方程模型的设定,3.在每一条路径上以小写的英文或希腊字母表示待估计的结构系数或方差,以数字表示事先确定的固定参数; 4.在图中,凡为因果路径所指者,为内生变量,凡无如此箭头所指者为外生变量。,二、结构方程模型的设定,RAM图示例,二、结构方程模型的设定,模型设定的方程形式(按照LISREL的规定) 结构方程模型由3组方程,4组变量(2组有数据),8个参数矩阵(待估计)所组成:,二、结构方程模型的设定,符号规定 四组变量:,二、结构方程模型的设定,
12、三组方程,结构方程:,外生隐变量测量方程:,内生隐变量测量方程:,二、结构方程模型的设定,符号规定 8个参数矩阵: Beta(记做B或BE):内生隐变量间结构系数矩阵; Gamma(记做或GA):内生与外生隐变量间结构系数阵; Phi(记做或PH):外生隐变量的协差阵; Psi(记做或PS):内生隐变量误差项的协差阵;,二、结构方程模型的设定,Lambda X(记做X 或LX):外生隐变量与其指标变量间的结构系数矩阵; Theta Delta(记做或TD):外生显变量测量误差项的协差阵; Lambda Y(记做Y或LY):内生隐变量与其指标变量间的结构系数矩阵; Theta Epsilon(记
13、做或TE):内生显变量测量误差项的协差阵。,二、结构方程模型的设定,前图用方程形式表示:,二、结构方程模型的设定,4个结构系数矩阵是:,二、结构方程模型的设定,4个协方差阵是:,三、模型的识别,联立方程都存在识别问题,即是否有足够的方程以求得未知参数的解。一般说来,有三种识变状态: 不能识别(Under identified) 恰好识别(Just identified) 过度识别(Over identified),三、模型的识别,识别条件之一:t规则 协差阵中数据点的个数必须大于待估参数的个数,这一条件是必要非充分条件。 SEM以最小化估计协差阵与样本协差阵为目标函数,1个数据点即意味着一个方
14、程。 如果将外生显变量的个数记为p,内生显变量的个数为q,则待估参数(包括自由参数、限制参数)的个数不能超过:,三、模型的识别,识别条件之二:递归规则 最好只使用单向因果箭头,即递归模式。 当存在双向因果,以及A影响B,B影响C,C又影响A等所谓非递归模式时,也可能获得识别。,三、模型的识别与估计,实际中应遵守的其他规则 a 一个隐变量一般最好选择3个以上显变量作为其指标变量 如果只选择了一个显变量,必须假设该显变量完全无误差的测量了隐变量,在路径图上表示为该显变量不能有误差项,而且其与隐变量间的路径系数应预先设定为1;,三、模型的识别,b 必须为模型中的隐变量建立一个测量尺度 具体的做法或是
15、将隐变量的方差规定为1,使隐变量具有标准化的尺度;或是将此隐变量与其指标变量中的任何一个的结构系数设定为常数,通常为1; c 方程中任何一个变量,如果仅作为原因而存在,即无因果箭头指向,应设定它不受误差项的影响;,三、模型的识别,d 如果一个内生变量是显变量,为避免被误当成某个隐变量的指标变量,要: 设置一个虚拟隐变量; 将该显变量作为其唯一指标变量; 结构系数设置为1; 该指标变量设定不受测量误差的影响。,三、模型的识别,根据建模结果进行诊断: 参数值的标准误过大 出现不可能的估计值,如负的方差,大于1的标准化系数 估计结果对初始值敏感 单一系数识别的观察:先估计整个模型,以所得该系数估计值
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第九 变量 模型
链接地址:https://www.31doc.com/p-3442061.html