第4章判别分析2.ppt
《第4章判别分析2.ppt》由会员分享,可在线阅读,更多相关《第4章判别分析2.ppt(101页珍藏版)》请在三一文库上搜索。
1、1,第四章 判别分析,2,第四节 费歇(Fisher)判别法,3,Fisher判别法是1936年提出来的,该方法的主要思想是通过将多维数据投影到某个方向上,投影的原则是将总体与总体之间尽可能的分开,然后再选择合适的判别规则,将新的样品进行分类判别。,右图中有A、B两个总体。在原始变量(指标)X1、X2的方向上,A、B都有很大的重叠,难以区分清楚。但是,如果以X1、X2为横、纵坐标轴构建一个平面,若能设法找到一个y轴,使得当X1X2平面上的散点投射到y轴上时,两组观察值的重叠程度最小,则综合指标y的区分能力显然大于原先的X1、X2 。,y,x2,x1,一、Fisher判别的基本思想,4,一、Fi
2、sher判别的基本思想,5,一、Fisher判别的基本思想,6,二、Fisher判别函数的构造,1、针对两个总体的情形,7,1、针对两个总体的情形,8,2、针对多个总体的情形,9,2、针对多个总体的情形,10,11,三、线性判别函数的求法,12,13,14,15,16,17,18,一般需要多少个判别式就够用了?,19,另外一种求4.23式的思路*,20,另外一种求4.23式的思路*,21,需要指出是,此处利用极值原理求极值时,只给出了必要条件的数学推导,而省略了有关充分条件的论证,因为在实际问题中,往往根据问题本身的性质就能肯定有最大值(或最小值),如果所求的驻点只有一个,这时就不需要根据极值
3、存在的充分条件判定它是极大还是极小,而是直接能肯定这唯一的驻点就是所求的最大值(或最小值)。为了避免较多的数学推导,这里不追求数学上的完整性。,另外一种求4.23式的思路*,22,总体参数未知情况下的解决方法,23,24,25,判别规则,26,判别规则,27,判别函数U(X)的另一种形式,28,例题4.5,经典案例:费希尔于1936年发表的鸢尾花(Iris)数据,被广泛用为判别分析的例子。数据是对3种鸢尾花:刚毛鸢尾花(第一组)、变色鸢尾花(第二组)和弗吉尼亚鸢尾花(第三组),各自抽取一个容量为50的样本,测量其花萼长度x1、花萼宽度x2、花瓣长度x3、花瓣宽度x4,单位为mm。,29,30,
4、31,32,33,求解特征值与特征向量,34,求判别函数,35,最后,确定判别规则,36,最后,确定判别规则,37,本例题SPSS的几个关键输出结果,特征值,38,中心化的Fisher判别函数U1(X)和U2(X)的取值:,39,各判别函数的组均值为:,40,41,几种判别方法的关系*,Fisher判别与距离判别对判别变量的分布并无要求,而贝叶斯判别要求了解判别变量的先验分布,因此,Fisher判别核距离判别相对于贝叶斯判别,较为简单实用;当然,后者更加精确。 当k2且两个总体协差阵相等时,Fisher判别与距离判别是等价的。当判别变量服从正态分布,且不考虑误判代价时,它们与贝叶斯判别也是相同
5、的。,42,第五节 实例分析与计算机实现,这一节我们利用SPSS对Fisher判别法和Bayes判别法进行计算机实现。 例题4.6:为研究某地区人口死亡状况,已按某种方法将15个已知地区样品分为3类,指标含义及原始数据如下。试建立判别函数,并判定另外4个待判地区属于哪类?(本例SPSS数据文件:4-6.sav),43,表4.1 各地区死亡概率表,44,分类变量Group取值的设置,45,开始判别分析,46,(一) 操作步骤 1. 在SPSS窗口中选择AnalyzeClassifyDiscriminate,调出判别分析主界面,将左边的变量列表中的“group”变量选入分组变量中,将X1至X6变量
6、选入自变量中,并选择Enter independents together单选按钮,即使用所有自变量进行判别分析。,47,2. 点击Define Range按钮,定义分组变量的取值范围。本例中分类变量的范围为1到3,所以在最小值和最大值中分别输入1和3。单击Continue按钮,返回主界面。,48,3. 单击Statistics按钮,指定输出的描述统计量和判别函数系数。选中Function Coefficients栏中的Fishers和Unstandardized。然后,单击Continue按钮,返回主界面。,49,这两个选项的含义如下: Fishers:给出Bayes判别函数的系数。(注意:
7、这个选项不是要给出Fisher判别函数的系数。这个复选框的名字之所以为Fishers,是因为按判别函数值最大的一组进行归类这种思想是由Fisher提出来的。这里极易混淆,请同学注意。) Unstandardized:给出未标准化的Fisher判别函数(即典型判别函数,也即我们前面讲过的“中心化的Fisher判别函数”)的系数(SPSS默认给出标准化的Fisher判别函数系数)。,50,设置均值、协差阵检验,Boxx M是对各总体协差阵是否相等进行齐性检验 Means可给出各总体均值是否相等的Wilks统计量。 Within-groups correlation给出各自变量之间的相关系数矩阵 最
8、后点击“Continue”回到上一级菜单。,51,4. 再单击Classify按钮,定义判别分组参数和选择输出结果。选择Display栏中的Casewise results,输出一个判别结果表,包括每个样品的判别分数、后验概率、实际组和预测组编号等。Plots栏中选中“Combined-Groups”,在同一幅图中输出各组的Fisher判别函数(投影)值。再选择summary table,将输出分类结果表“Classification Results”;其余的均保留系统默认选项。单击Continue按钮。,52,5. 单击Save按钮,指定在数据文件中生成代表判别分组结果和判别得分的新变量,生
9、成的新变量的含义分别为: Predicted group membership:存放判别样品所属组别的值; Discriminant scores:存放Fisher判别得分的值,有几个典型判别函数就有几个判别得分变量; Probabilities of group membership:存放样品属于各组的Bayes后验概率值。 将对话框中的三个复选框均选中,单击Continue按钮返回。,53,6. 返回判别分析主界面,单击OK按钮,运行判别分析过程。,Save子对话框,54,(二) 主要运行结果解释,各原始变量相关系数矩阵 可见,第1与第3、第1与第2、第3与第4等指标间的存在一定相关,55
10、,(二) 主要运行结果解释,各总体均值是否相等的检验结果 可见,第1、2、6个指标在各总体间的差异并不大,56,各组均值和离差的描述性统计: 确实发现三个总体在第1、2、6指标的均值比较接近,以第一个指标“0岁组死亡率”为例:,57,协差阵齐性检验结果: 由于样本资料矩阵的秩小于5(p-1)(原因?),不是非奇异矩阵,无法给出Boxs检验结果。 可见,第1、2、6个指标的同均值,确实对检验产生了影响,(二) 主要运行结果解释,58,因此,应该剔除第1、2、6个指标,重新进行分析:,(二) 主要运行结果解释,59,各组均值和离差的描述性统计:,(二) 主要运行结果解释,60,剔除第1、2、6个指
11、标后重新进行分析,得到的均值检验结果为:,(二) 主要运行结果解释,61,剔除第1、2、6个指标后重新进行分析,得到的协差阵齐性检验结果为:,(二) 主要运行结果解释,62,可见,判别分析开始前,有必要对各个总体的均值是否相等进行假设检验。 接下来,出于课堂演示的需要,我们继续使用原有全部六个指标,进行后续的判别分析,(二) 主要运行结果解释,63,特征值: Wilkss Lambda,是对Fisher判别函数的显著性进行检验。,(二) 主要运行结果解释,典型相关系数(Canonical Correlation)的平方,说明了判别函数因变量的变动,可以在多少程度上由自变量的变化所解释; 也即,
12、该平方项反映这个判别函数携带了多少原始数据的信息,该值反映了该判别函数的信息价值,当然越大越好。,65,(二) 主要运行结果解释,1. Standardized Canonical Discriminant Function Coefficients(给出标准化的典型判别函数系数) 标准化的典型判别函数是由标准化的自变量通过Fisher判别法得到的,所以要得到标准化的典型判别得分,代入该函数的自变量必须是经过标准化的。,何谓“Canonical”(典型)?,This means that all variables have the same scale so that the coeffic
13、ients of the discriminant are not affected by different scales. E.g. MARITAL = 0 or 1 and AGE = 18 - 80.,Interpretation of the parameters: Looking at the absolute values of the weights or coefficients gives an indication of which independent variables are more (or less) important in predicting which
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 判别分析
链接地址:https://www.31doc.com/p-2604969.html