主成分分析法及其在SPSS中的操作.pdf
《主成分分析法及其在SPSS中的操作.pdf》由会员分享,可在线阅读,更多相关《主成分分析法及其在SPSS中的操作.pdf(7页珍藏版)》请在三一文库上搜索。
1、一、主成分分析基本原理 概念: 主成分分析是把原来多个变量划为少数几个综合指标的一种统计分析 方法。从数学角度来看,这是一种降维处理技术。 思路:一个研究对象, 往往是多要素的复杂系统。 变量太多无疑会增加分析 问题的难度和复杂性, 利用原变量之间的相关关系, 用较少的新变量代替原来较 多的变量,并使这些少数变量尽可能多的保留原来较多的变量所反应的信息,这 样问题就简单化了。 原理:假定有 n 个样本,每个样本共有p 个变量,构成一个np 阶的数据 矩阵, 记原变量指标为x1,x2, xp,设它们降维处理后的综合指标,即新变量 为 z1,z2,z3, ,zm(mp),则 系数 lij的确定原则
2、: zi与 zj(i j ;i ,j=1 ,2, m )相互无关; z1是 x1, x2, , xP的一切线性组合中方差最大者, z2是与 z1不相关的 x1, x2, , xP的所有线性组合中方差最大者; zm是与 z1,z2, zm 1都不相关的 x1, x2,xP, 的所有线性组合中方差最大者。 新变量指标 z1, z2, , zm分别称为原变量指标x1, x2, , xP的第 1, 第 2, , 第 m主成分。 从以上的分析可以看出,主成分分析的实质就是确定原来变量xj(j=1 , 2 , p )在诸主成分 zi(i=1 ,2, m )上的荷载 lij( i=1 ,2, m ; j=1
3、 ,2 , p) 。 npnn p p xxx xxx xxx X 21 22221 11211 pmpmmm pp pp xlxlxlz xlxlxlz xlxlxlz 2211 22221212 12121111 从数学上可以证明, 它们分别是相关矩阵m个较大的特征值所对应的特征向 量。 二、主成分分析的计算步骤 1、计算相关系数矩阵 rij(i ,j =1,2, p)为原变量 xi与 xj的相关系数,rij =r ji,其计算公 式为 2、计算特征值与特征向量 解特征方程,常用雅可比法( Jacobi )求出特征值,并使其按大 小顺序排列; 分别求出对应于特征值的特征向量,要求 =1 ,
4、即 其中表示向量的第 j 个分量。 3、计算主成分贡献率及累计贡献率 贡献率: 累计贡献率: 一般取累计贡献率达85%-95% 的特征值,所对应的第1、第 2、第 m (m p)个主成分。 4、计算主成分载荷 5、各主成分得分 pppp p p rrr rrr rrr R 21 22221 11211 n k n k jkjiki n k jkjiki ij xxxx xxxx r 11 22 1 )()( )( 0RI 0 21p i ),2,1(piei L i e 1 1 2 p j ij e ij e i e ), 2, 1( 1 pi p k k i L ), 2, 1( 1 1 p
5、i p k k i k k L m , 21 L ),2, 1,(),(pjiexzpl ijijiij L 三、主成分分析法在SPSS 中的操作 1、指标数据选取、收集与录入(表1) 2、Analyze Data Reduction Factor Analysis,弹出 Factor Analysis 对 话框: 3、把指标数据选入Variables 框,Descriptives: Correlation Matrix 框组 中选中 Coefficients,然后点击 Continue, 返回 Factor Analysis 对话框,单 击 OK 。 注意: SPSS 在调用 Factor
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 成分 分析 及其 SPSS 中的 操作
链接地址:https://www.31doc.com/p-5525966.html