基于粗糙集和遗传神经网络集成的个人信用评价模型-文档资料.ppt
《基于粗糙集和遗传神经网络集成的个人信用评价模型-文档资料.ppt》由会员分享,可在线阅读,更多相关《基于粗糙集和遗传神经网络集成的个人信用评价模型-文档资料.ppt(21页珍藏版)》请在三一文库上搜索。
1、1,目录,引言,RS和GA-NN集成模型,2,实证分析,2,1. 引言,个人信用评价问题,商业银行零售信贷业务的不断发展,使得个人信用评价的重要性日益加强。个人信用评价是指商业银行根据个人的信用信息给出每个贷款申请者能够偿还贷款的可能性(Chen,Huang,2003)1。面对客户提出的贷款申请,银行需要根据客户提出的基本信息和以往的资信记录,包括姓名、年龄、家庭住址、职业、每月收入、信用卡消费纪录、以往贷款还贷纪录等,采用科学的方法对客户的信用进行评估,以决定是否向该客人户发放贷款(Lee等人,2003)2。,3,1. 引言,文献综述,随着人工智能技术的发展,包括人工神经网络(Artific
2、ial Neural Networks,ANN)、支持向量机(Support Vector Machine,SVM)、遗传算法(Genetic Algorithm,GA)、粗糙集(Rough Set,RS)以及各种方法相互结合的组合模型逐步应用到个人信用评价中来。Huang等人(2006)3将这些模型分为以功能为基础的方法(如GA、ANN等)和以归纳为基础的方法(如Apriori 算法、决策树、RS等)。同时,各种各样的研究着重于集成一些以功能为基础的模型,来提高分类精度。,4,1. 引言,文献综述,朱兴德等人(2003)4提出了一种基于GA的神经网络个人信用评估模型,利用标准GA和Solis
3、&Wets算法的混合算法同时优化神经网络的结构和权重阈值系数。 姜明辉等人( 2008 )5将GA与SVM 进行结合,构建了个人信用评估GA-SVM 模型,用GA来选择SVM参数,并通过GA适应度函数的设置,来控制给商业银行造成较大损失的“取伪”误判的发生。,5,1. 引言,文献综述,对以归纳为主的算法,其主要的优点在于这些算法可以向决策者提供可理解的IF-THEN规则,帮助他们理解数据真实的内容。 Huang等人(2006)3提出了一种两阶段遗传模型来研究信用评价模型,该模型通过遗传规划来提取IF-THEN规则,取得了很好的分类效果。然而,以归纳为主的模型存在的主要问题是预测能力不强,如果一
4、个样本新个体不符合任何规则,就无法确定它的信用类别6。,6,1. 引言,为了结合两种模型的优点,柯孔林等人(2008)7将RS和BP神经网络进行组合,针对商业银行企业贷款业务,构造了五级分类评价模型。然而,BP神经网络存在一些问题,如稳定性差,容易陷入局部极值。此外,目前国内很少有学者将以归纳为基础的方法和以功能为基础的方法集成来研究商业银行个人信用评价问题,因此,本文提出了以RS和遗传神经网络(GA-Neural Network,GA-NN)集成的混合信用评价模型,通过基于GA的RS来约简信用评价指标,降低了GA-NN输入层的结点数,提高了分类精度;通过RS来提取个人信用评价规则库,有利于决
5、策者更好地掌握数据信息和执行信贷决策。,7,2. RS和GA-NN集成模型,RS和GA-NN集成的个人信用评价模型主要由两部分组成,见图1。 第一部分是模型训练,包括三个步骤: (1)样本数据预处理:离散化和归一化; (2)应用GA简约评价指标; (3)采用RS,基于最小简约指标提取判别规则,形成个人信用评价判别规则库。 第二部分是模型检验,将检验样本评价指标值与规则库进行匹配,会出现匹配和不匹配两种情况。用RS判别与规则库匹配的检验样本信用等级,GA-NN算法作为辅助模型,判别不与规则库任何规则匹配的检验样本信用等级。,分类结果,8,2. RS和GA-NN集成模型,评价指标属性约简,在决策过
6、程中,并不是属性越多越好,而是遵循样本的属性特征足够刻画样本特征的选择原则。这是因为属性过多时,样本中会更容易夹杂一些噪声数据,对于计算空间的要求以及算法的时间要求都会增加,增加问题的复杂性。因此,本文对样本进行知识约简。知识约简,就是指保持知识库分类能力不变的条件下,删除其中不相关或不重要的冗余知识。现有的约简算法,主要是是从RS的核出发,采用启发式搜索的方法构造所含条件属性最少的约简,即最小约简(陶志等人,2003)8。 通过删除条件指标 的前后近似质量之差 来考察条件指标 对于决策属性D 的重要性,如果 ,则认为评价指标 对于决策属性D 没有影响,可以在评价指标集中将其删除。本文采用GA
7、寻找最小相对约简8:假设评价指标集合为 ,评价指标空间,染色体为长度为,制位串,每一位对应一个条件属性。若某位取值为1,则表示选择其对应的条件属性;,的二进,9,2. RS和GA-NN集成模型,评价指标属性约简,若某位取值为0,则去除其对应的条件属性。这样,每一个染色体个体对应了条件属性空间中的一个属性子集。定义自适应函数为(柯孔林等人,2008)7 :,式中:L表示染色体 选择了的评价指标个数,Z表示染色体 覆盖决策表的行 数, 为评价指标个数, 为训练样本数。,10,2. RS和GA-NN集成模型,信用评价规则生成,商业银行零售客户的数据库以二维数据表的形式表示,决策表 表示为 , 表中的
8、每一行描述一个零售客户,所有零售客户的集合称为论域 ,每一列描述一个属性,属性可以分为条件属性(评价指标)和决策属性(贷款与否), 为属性集合,C 和D分别为评价指标集和决策属性集合, , 是属性 的值域 9。 利用RS生成商业银行零售客户信用评价规则库是以决策表作为单位进行的,将GA约简的评价指标作为规则的前部,决策属性作为规则的后部,由此形成判别规则。若 为评价指标 的离散值, 为决策属性D 的取值,则由简化后的评价指标生成的个人信用判别规则表示为:,11,2. RS和GA-NN集成模型,GA-NN构造,基于采用标准GA简约得到的最小评价指标集及相应的经过归一化之后的标准化数据形成最新的学
9、习样本,对GA-NN系统进行学习和训练。基本操作步骤如下:,(1)选择合适的参数,包括群体规模 ,交叉概率,和变异概率,(2)确定适应度函数 ,为期望输出,,为神经网络的输出,(3)随机产生一组初始染色体,计算每一个染色体的适应值,同时计算,群体的总适应值,(4)采用实数编码方法,本文把一组网络权值和阈值连接成一个GA中的染色体,12,2. RS和GA-NN集成模型,GA-NN构造,(5)计算每一串的选择概率,和累计概率,以轮盘赌方式,进行个体的选择;,(6)对每串产生随机数,,若,一组后,随机配对,对每一对,产生,则参加交叉操作,选出参加操作的,间的随机数以确定交叉的位置;,(7)可能变异的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 粗糙 遗传 神经网络 集成 个人信用 评价 模型 文档 资料
链接地址:https://www.31doc.com/p-1933363.html