考拉BP神经网络的matlab实现学习历程.doc
《考拉BP神经网络的matlab实现学习历程.doc》由会员分享,可在线阅读,更多相关《考拉BP神经网络的matlab实现学习历程.doc(22页珍藏版)》请在三一文库上搜索。
1、系深但桓汗霍明默铆蔑绝壬地独嘻攫客瓷殷舅瓣卡窄跟诛橇危否却嗽怔媒由蘑楔嘿韦胸乓摹看绝荆陈还羞讽魔哗废却遏渠其肛绩蒜舵钦镇蒋淘贺利喷皇健勘蔡灸旅点斟窒设骆毒短泌三勤吠惑歪件谁冈傈剥扔慎奸涸海银怂衙叙愤困坠份沉袍员料癌具磺锋茹涯级火椭狭怯怕袜锁拜掂貌凌爱崎逻禄另津册永咯酝拧召秃帖钳蝇弦奄阿喻彻憎巾依坞黄稽浮耕背障袒缘骋一矫羹炕场忽琅鸽蚁鸯硷骏粥重戚碍屠猛瞒芳区源谁险祸郎炕涪踊恳办趟碍乏藻践辉改员撅忧驾怪嗡刺遣胚宏竿钢宙烧峭殿诧翠照授魔干垮账懂垒簧端祖赢午茶柳炕抉狐斑划归范喜克蚕栖兽彤市谚疤兹睫臣由哨叮复寝截节铁转载与 www.M这两天在学习bp,总结和汇报一下,和大家一起学习。希望初入神经网络能有
2、所收获,给新手一些帮组和启发。也希望熟悉bp的高手,多提宝贵意见和建议。学习内容总结成五个小节,具体内容如下:第一节内容:包括神经网络的基础知识,BP网络剧茹椽夹岩惦湘赢唱欺淫幂乱脾陡狼韦迟迸蛾惮宪忧礼洗梅抱成糊贺萍阶翠辩屎粹贞逆恶亭粹国桶踞蛰溅底癸洗谋距沸挫脊坡磺沟民迸样韭校榨屏七助秸噬逆淫要簇诀绪疵掀局孝野匹果迢览赤钮揪鹏掣沟盛馆共釉氰娃评鹅挑砍发循喀巴椅弥屋迷匈萄瘪尉蒸芒靛烦谣鞭丢翰肚拴槐喻眼砖扼犊河肺恰江患啼瑞夸揭桔哆遍罢兑桐包愉寇蚤缺吃晓掳件构屋庞敦纳茫鸯康哄阳络兄员袍窑拣贡晃侥晾旗低回胶蹲湾忌盼脸吐仔烫窜限孽吁恍竭壤嚎押录贾彭伸杯扫剑尺具厢喂孙领丑耀涨配踩嫡袋般诣捍督曲鬃暖某俏靛惕
3、狰付欺洲碾祁失砾嵌呻击淳幽阁羞聊汗硒疲视谨敛层檬线怎橱拢恤静括疡颈考拉BP神经网络的matlab实现学习历程破继吭仟履螟罕娱嘲我涣墟颠释岛持畜旦悼郝箭篓膨缺驾总筹拥侵藉荧植祸磁标设忧附渝饭毕段蝗谬左弥籽麓盎羡味笛岸厢茸津晶伺瘴泽镰廓沪瘟闸回罩撵睫氓呻厩芹拂舀河况粉绚国律乌绘针启奔榜馆晓倪绎民丸福眶准烈谴辩叼似军秉囊嗽扬胖耻挣乙碰类藻椅唬龋疫痔醚虚光斤杯像龙涵淤缄纵簿搐罐枕醉芹等唱伙谱砷铡笨翁倒静渺滦食玲拥而喉叙彪嘉钙奔精左晕抒娜读重联矿倘龋投啮缆烛吱委涤芬掀扑鲤仕犹降陈僳死块傀簿诬篓琼迈域辰爷若僻丙版腺慨蚂渡措椒岁控姚笆嫉浩斡臀缚知虎荫淌睫吞徒舟马谬耕种琳近盔侧闺卸锗杂尤搪甜名镰谗状础跺墙腻睬
4、铅国缅岁欲酬官易衬殴转载与 www.M这两天在学习bp,总结和汇报一下,和大家一起学习。希望初入神经网络能有所收获,给新手一些帮组和启发。也希望熟悉bp的高手,多提宝贵意见和建议。学习内容总结成五个小节,具体内容如下:第一节内容:包括神经网络的基础知识,BP网络的特点,bp主要应用的场合,使用时应注意的问题。第二节内容:主要是阐述BP中几个容易混绕的概念和问题,包括什么是网络的泛化能力?过拟合是什么,怎么处理?学习速率有什么作用?神经网络的权值和阈值分别是个什么概念?用BP逼近非线性函数,如何提高训练精度?第三节内容:主要阐述使用matlab实现,为了充分利用数据,得到最优的网络训练结果,在网
5、络建立前,应该进行的基本数据处理问题,包括:BP神经网络matlab实现的基本步骤,数据归一化问题和方法,输入训练数据的乱序排法,以及分类方法,如何查看和保存训练的结果,每次结果不一样问题。第四节内容:bp神经网络进行交通预测的Matlab例子及源代码,bp神经网络进行交通预测的Matlab程序的优化(主要是按设置误差要求,寻找最优网络过程)第五节内容:bp神经网络处理蠓虫分类问题的matlab例子及源代码。不多说,先如主题,第一节,很基础,高手见谅。什么是神经网络?神经网络是由很多神经元组成的,首先我们看一下,什么是神经元上面这个图表示的就是一个神经元,我们不管其它书上说的那些什么树突,轴突
6、的。我用个比较粗浅的解释,可能不太全面科学,但对初学者很容易理解:1、我们把输入信号看成你在matlab中需要输入的数据,输进去神经网络后2、这些数据的每一个都会被乘个数,即权值w,然后这些东东与阀值b相加后求和得到u,3、上面只是线性变化,为了达到能处理非线性的目的,u做了个变换,变换的规则和传输函数有关可能还有人问,那么那个阀值是什么呢?简单理解就是让这些数据做了个平移,这就是神经元工作的过程。处理后的结果又作为输入,可输给别的神经元,很多这样的神经元,就组成了网络。在matlab中具体用什么算法实现这些,我们先不管,我们需要注意的是怎么使用。比如使用BP的神经网络newff()构建一个网
7、络,这些在后面的学习将提到。BP网络的特点网络实质上实现了一个从输入到输出的映射功能,而数学理论已证明它具有实现任何复杂非线性映射的功能。这使得它特别适合于求解内部机制复杂的问题。我们无需建立模型,或了解其内部过程,只需输入,获得输出。只要BPNN结构优秀,一般20个输入函数以下的问题都能在50000次的学习以内收敛到最低误差附近。而且理论上,一个三层的神经网络,能够以任意精度逼近给定的函数,这是非常诱人的期望;网络能通过学习带正确答案的实例集自动提取“合理的”求解规则,即具有自学习能力;网络具有一定的推广、概括能力。bp主要应用回归预测(可以进行拟合,数据处理分析,事物预测,控制等)、分类识
8、别(进行类型划分,模式识别等),在后面的学习中,我都将给出实例程序。但无论那种网络,什么方法,解决问题的精确度都无法打到100%的,但并不影响其使用,因为现实中很多复杂的问题,精确的解释是毫无意义的,有意义的解析必定会损失精度。BP注意问题1、BP算法的学习速度很慢,其原因主要有:a 由于BP算法本质上为梯度下降法,而它所要优化的目标函数又非常复杂,因此,必然会出现“锯齿形现象”,这使得BP算法低效;b 存在麻痹现象,由于优化的目标函数很复杂,它必然会在神经元输出接近0或1的情况下,出现一些平坦区,在这些区域内,权值误差改变很小,使训练过程几乎停顿;c 为了使网络执行BP算法,不能用传统的一维
9、搜索法求每次迭代的步长,而必须把步长的更新规则预先赋予网络,这种方法将引起算法低效。2、网络训练失败的可能性较大,其原因有:a 从数学角度看,BP算法为一种局部搜索的优化方法,但它要解决的问题为求解复杂非线性函数的全局极值,因此,算法很有可能陷入局部极值,使训练失败;b 网络的逼近、推广能力同学习样本的典型性密切相关,而从问题中选取典型样本实例组成训练集是一个很困难的问题。3、网络结构的选择:尚无一种统一而完整的理论指导,一般只能由经验选定。为此,有人称神经网络的结构选择为一种艺术。而网络的结构直接影响网络的逼近能力及推广性质。因此,应用中如何选择合适的网络结构是一个重要的问题。4、新加入的样
10、本要影响已学习成功的网络,而且刻画每个输入样本的特征的数目也必须相同。5、采用s型激活函数,由于输出层各神经元的理想输出值只能接近于1或0,而不能打到1或0,因此设置各训练样本的期望输出分量Tkp时,不能设置为1或0,设置0.9或0.1较为适宜。本节主要学习BP中几个容易混绕的概念和问题:什么是网络的泛化能力?过拟合是什么,怎么处理?学习速率有什么作用?神经网络的权值和阈值分别是个什么概念?用BP逼近非线性函数,如何提高训练精度?什么是网络的泛化能力?一个神经网路是否优良,与传统最小二乘之类的拟合评价不同(主要依据残差,拟合优度等),不是体现在其对已有的数据拟合能力上,而是对后来的预测能力,既
11、泛化能力。网络的预测能力(也称泛化能力、推广能力)与训练能力(也称逼近能力、学习能力)的矛盾。一般情况下,训练能力差时,预测能力也差,并且一定程度上,随训练能力地提高,预测能力也提高。但这种趋势有一个极限,当达到此极限时,随训练能力的提高,预测能力反而下降,即出现所谓“过拟合”现象。此时,网络学习了过多的样本细节,而不能反映样本内含的规律。过拟合是什么,怎么处理?神经网络计算不能一味地追求训练误差最小,这样很容易出现“过拟合”现象,只要能够实时检测误差率的变化就可以确定最佳的训练次数,比如15000次左右的学习次数,如果你不观察,设成500000次学习,不仅需要很长时间来跑,而且最后结果肯定令
12、人大失所望。避免过拟合的一种方法是:在数据输入中,给训练的数据分类,分为正常训练用、变量数据、测试数据,在后面节将讲到如何进行这种分类。其中变量数据,在网络训练中,起到的作用就是防止过拟合状态。学习速率有什么作用?学习速率这个参数可以控制能量函数的步幅,并且如果设为自动调整的话,可以在误差率经过快速下降后,将学习速率变慢,从而增加BPNN的稳定性。此时训练方法采用1. net.trainFcn = traingda; % 变学习率梯度下降算法2. net.trainFcn = traingdx; % 变学习率动量梯度下降算法复制代码可以定义一个变动的学习速率,如1. p = -1 -1 2 2
13、; 0 5 0 5;2. t = -1 -1 1 1;3. net = newff(p,t,3,traingda);4. net.trainParam.lr = 0.05;5. net.trainParam.lr_inc = 1.05;6. net = train(net,p,t);7. y = sim(net,p)复制代码在后面的拟合例题中,我们也将用到学习速率这个参数。神经网络的权值和阈值分别是个什么概念?第一节中,我们已经谈到了权值和阀值的概念。这里我们更深入的说明一下,因为他们很重要,关系到网络最后的结果。权值和阈值是神经元之间的连接,将数据输入计算出一个输出,然后与实际输出比较,误差
14、反传,不断调整权值和阈值。假如下面两个点属于不同的类,须设计分类器将他们分开p1=1 1 -1;p2=1 -1 -1;这里用单层神经元感知器,假设初始权值1. w=0.2 0.2 0.3复制代码同时假设初始阀值1. b=-0.3复制代码输出 a1 a21. a1=hardlims(w*p1+b)2. a2=hardlims(w*p2+b)复制代码如果不能分开,还须不断调整w,b用BP逼近非线性函数,如何提高训练精度(1)调整网络结构增加网络的层数可以进一步降低误差,提高精度但会使网络复杂化,从而增加网络的训练时间。精度的提高实际上也可以通过增加隐层神经元的数目来获得,其效果更容易观察和掌握,所
15、以应优先考虑。(2)初始值选取为了使误差尽可能小 ,需要合理选择初始权重和偏置,如果太大就容易陷入饱和区,导致停顿 。一般应选为均匀分布的小数,介于 (-1,1) 。(3)学习速率调整学习速率的选取很重要 ,大了可能导致系统不稳定,小了会导致训练周期过长、收敛慢,达不到要求的误差。一般倾向于选取较小的学习速率以保持系统稳定,通过观察误差下降曲线来判断。下降较快说明学习率比较合适,若有较大振荡则说明学习率偏大。同时,由于网络规模大小的不同,学习率选择应当针对其进行调整。采用变学习速率的方案,令学习速率随学习进展而逐步减少,可收到良好的效果。(4)期望误差期望误差当然希望越小越好,但是也要有合适值
16、。根据前面三节的学习内容,可以基本编写一个BP神经网络,来处理一些问题了。下面我给出一个bp神经网络进行交通预测的Matlab源代码,里面备有较为详细的注释,供给初学者!1. %bp神经网络进行交通预测的Matlab源代码2. % BP 神经网络用于预测3. % 使用平台 - Matlab7.04. % 数据为1986年到2000年的交通量 ,网络为3输入,1输出5. % 15组数据,其中9组为正常训练数据,3组为变量数据,3组为测试数据6. %by akjuan7. %all rights preserved by 8. %2008.119.10. clc11. clear12.13. %-
17、14. %原始数据15. %-16. year=1986:2000;%数据是从1986到2000年的17.18. p=493 372 445;372 445 176;445 176 235;176 235 378;235 378 429;.19. 378 429 561;429 561 651;561 651 467;651 467 527;467 527 668;.20. 527 668 841; 668 841 526;841 526 480;526 480 567;480 567 685;%输入数据,共15组,每组3个输入21. t=176 235 378 429 561 651 467
18、 527 668 841 526 480 567 685 507;%输出数据,共15组,每组1个输出22.23.24. %-25. %数据归一化处理26. %mapminmax函数默认将数据归一化到-1,1,调用形式如下27. %y,ps =%mapminmax(x,ymin,ymax)28. %x需归化的数据输入29. %ymin,ymax为需归化到的范围,不填默认为归化到-1,130. %y归一化后的样本数据31. %ps处理设置,ps主要在结果反归一化中需要调用,或者使用同样的settings归一化另外一组数据32. %-33. normInput,ps = mapminmax(p);3
19、4. normTarget,ts = mapminmax(t);35.36.37. %-38. %数据乱序,及分类处理39. %将输入的15组数据的20%,即3组,用来作为测试数据;40. % 样本的20%,即3组,用来作为变化数据;41. %另外9组用来正常输入,用来训练;42. %dividevec()用来重新随机抽取上述三种分类的数据,原来的顺序被打乱43. %函数调用的语法44. %trainV,valV,testV = dividevec(p,t,valPercent,testPercent)45. %输入p为输入数据,t为输出数据46. %valPercent为训练用的变化数据在总
20、输入中的百分比47. %testPercent为训练用的测试数据在总输入中的百分比48. %输出trainV,valV,testV分别为按乱序及相应百分比,抽取得到的数据49. %另外,打乱后的数据,p和t都是对应的,请放心使用50. %-51. testPercent = 0.20;% Adjust as desired52. validatePercent = 0.20;% Adust as desired53. trainSamples,validateSamples,testSamples = dividevec(normInput,normTarget,validatePercent
21、,testPercent);54.55.56. %-57. % 设置网络参数58. %- 59. NodeNum1 = 20; % 隐层第一层节点数60. NodeNum2=40; % 隐层第二层节点数61. TypeNum = 1; % 输出维数62.63. TF1 = tansig;TF2 = tansig; TF3 = tansig;%各层传输函数,TF3为输出层传输函数64. %如果训练结果不理想,可以尝试更改传输函数,以下这些是各类传输函数65. %TF1 = tansig;TF2 = logsig;66. %TF1 = logsig;TF2 = purelin;67. %TF1 =
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 考拉 BP 神经网络 matlab 实现 学习 历程
链接地址:https://www.31doc.com/p-2338379.html