基于粗糙集神经网络在模式识别中应用.doc
《基于粗糙集神经网络在模式识别中应用.doc》由会员分享,可在线阅读,更多相关《基于粗糙集神经网络在模式识别中应用.doc(6页珍藏版)》请在三一文库上搜索。
1、基于粗糙集的神经网络在模式识别中的应用摘要:为解决神经网络在模式识别中存在的噪声问题,基于粗糙集的上、下近似和边界线集理论提出了一种对噪声样本进行处理的方法。该方法主要包括对处于下近似集内的含噪声属性值,将噪声消除后转换为理想状态下的属性值;对处于边界域内的含噪声属性值保持不变。当属性值处于边界域内属性的个数与全部属性数的比值达到某个确定的值时,就认为该样本受到噪声干扰过大,对其拒绝识别。通过实验对比表明,该方法能有效地降低BP网络模式识别的误识率。关键词:粗糙集 神经网络 模式识别中图分类号:TP18 文献标识码:AStudy on BP Network for Pattern Recogn
2、ition Based on RS TheoryFan li meng( School of Information Engineering, Hebei University of Technology, Tianjin 300401, China )Abstract: In order to solve the noise problem of BP network for pattern recognition,proposes a method to process the noisy samples based on the upper approximations, the low
3、erapproximations and the boundary region theories of rough sets. The method eliminates the noise of attribute values and changes them into ideal values when they are in the lower approximations; and those attribute values with noise will remain unchanged while they are in the boundary region. The sa
4、mple will be refused to recognize if the percent of its attributes with their values in the boundary region is over a certain point. The results of experiment show that the method can effectively reduce the false recognition rate of BP network for pattern recognition.Keywords: rough sets,BP network,
5、pattern recognition1 前言神经网络在模式识别中的应用十分广泛,由于网络训练样本中存在大量的冗余信息,常导致神经网络结构复杂、训练速度较慢、识别率不高等问题。粗糙集理论是一种处理含糊和不精确性问题的新型数学工具。自1982年波兰科学家Z.Pawlak 提出该理论以来,发展十分迅速。粗糙集理论具有强大的定性分析能力,不需要预先给定某些特征或属性的数量描述,能有效地分析和处理不精确、不完整、不一致数据,可以发现数据间隐藏的关系,提取有用的信息,简化信息处理。粗糙集的主要特点之一便是在分类能力保持不变的前提下,通过对知识的约简,导出概念的分类规则。近年来粗糙集理论在模式识别、机器学
6、习、故障诊断、知识获取与发现、决策分析与支持等领域取得了较为成功的应用。本文根据粗糙集的优点,在神经网络中引入粗糙集方法可有效地改善神经网络对有噪声、有冗余或不确定值数据输入模式的处理能力。粗糙集对神经网络和识别技术具有明显的方法学意义,特别是在模糊或不精确知识的表达、机器学习、决策分析、知识发现、模式识别等领域。在神经网络训练前,引用粗糙集理论对神经网络的训练样本进行属性约简,提取训练样本的重要特征,使得训练样本的输入向量维数减少,进而简化神经网络的结构,提高网络训练速度和识别率。2 方法原理(1)粗糙集基本理论知识表达系统为了处理智能数据,需要知识的符号表达,而知识表达系统(KRS)的基本
7、成分是研究对象的集合,因此可以表达为: (1)这里,U是论域,即为对象的集合;Q是属性集合,分为条件属性集C和决策属性集D,,;是属性值的集合,表示了属性的范围;f是的映射。知识表达系统K有时可以简写为:,它常用表格表达或决策表来实现。不可辨识关系对于,如果满足,则称对象x、y对于属性集合P是不可辨识的。否则,称x、y是可辨识的。由P决定的不可辨识关系记为即P中所有等价关系的交集。上近似、下近似及近似精度设,,表示包含元素的P等价类,定义集合Y的下近似和上近似分别为: (2) (3)此外定义为Y的边界或边界区域。显然,若或,则集合Y就是一个粗糙集概念。称为集合Y 的P -正区域(P-posit
8、ive region),称为集合Y 的P -反区域(P negative region)。知识的依赖性设K = (U, R)是一个知识库,P,Q R。当且仅当ind(P) ind(Q),则称Q依赖于P或P可推导出Q ,记做P Q 。当且仅当P Q 且Q P ,即ind(P) = ind(Q) ,则称P 和Q 是等价的,记作P = Q。当且仅当PQ且Q P均不成立,则称P和Q是独立的,记P Q。依赖性也可以是部分成立的,部分依赖性(部分可推导性)可以由知识的正区域来定义,即 (4)我们称知识Q以依赖度k(0 k 1)依赖于知识P ,记作 。当k = 1,则称知识Q完全依赖于知识P,即也记做PQ;
9、当0 k 1,则称知识Q部分依赖于知识P;当k = 0,则称知识Q完全独立于知识P。属性的重要性按照式(4),条件属性C和决策D间的依赖度可以写成。根据依赖度的变化,可以定义属性子集C C 关于D的重要性为: (5)特别当C= a时,属性aC关于D的重要性为: (6)一般来说,属性重要性即指属性在信息表中的重要程度,其数值大,则重要性高;反之,其重要性低。在相对属性约简中,属性重要性主要用来作为启发式信息。目前,关于属性重要性的定义有多种,比如有根据信息熵和根据差别矩阵出现的频度等形式的定义,不同定义下的属性重要性计算结果可能有所变化。BP神经网络BP 网络是一种多层前馈型神经网络,采用BP
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 粗糙 神经网络 模式识别 应用
链接地址:https://www.31doc.com/p-6178784.html