书签分享收藏举报版权申诉 / 355

立即下载加入VIP免费专享

当前位置：首页 > 其他 > 第1章神经网络控制理论.ppt

第1章神经网络控制理论.ppt

上传人：本田雅阁

文档编号：2597956

上传时间：2019-04-15

格式：PPT

页数：355

大小：3.23MB

《第1章神经网络控制理论.ppt》由会员分享，可在线阅读，更多相关《第1章神经网络控制理论.ppt（355页珍藏版）》请在三一文库上搜索。

1、1,李国勇编著电子工业出版社,智能预测控制及其MATLAB实现,2,目录第一篇神经网络控制及其MATLAB实现第二篇模糊逻辑控制及其MATLAB实现第三篇模型预测控制及其MATLAB实现,3,第一篇神经网络控制及其MATLAB实现,4,1.1 神经网络的基本概念 1.2 典型神经网络的模型及其MATLAB实现 1.3 神经网络控制系统,第1章神经网络控制理论,5,人脑是一部不寻常的智能机，它能以惊人的高速度解释感觉器官传来的含糊不清的信息。它能觉察到喧闹房间内的窃窃私语，能够识别出光线暗淡的胡同中的一张面孔，更能通过不断地学习而产生伟大的创造力。古今中外，许许多多科学

2、家为了揭开大脑机能的奥秘，从不同的角度进行着长期的不懈努力和探索，逐渐形成了一个多学科交叉的前沿技术领域神经网络(Neural Network)。,6,人工神经系统的研究可以追溯到1800年Frued的精神分析学时期，他已经做了一些初步工作。1913年人工神经系统的第一个实践是由Russell描述的水力装置。1943年美国心理学家Warren S McCulloch与数学家Walter H Pitts合作，用逻辑的数学工具研究客观事件在形式神经网络中的描述，从此开创了对神经网络的理论研究。他们在分析、总结神经元基本特性的基础上，首先提出神经元的数学模型，简称MP模型。从脑科学研究来看，MP模型

3、不愧为第一个用数理语言描述脑的信息处理过程的模型。后来MP模型经过数学家的精心整理和抽象，最终发展成一种有限自动机理论，再一次展现了MP模型的价值，此模型沿用至今，直接影响着这一领域研究的进展。,7,1949年心理学家D.O.Hebb提出关于神经网络学习机理的“突触修正假设”，即突触联系效率可变的假设，现在多数学习机仍遵循Hebb学习规则。1957年，Frank Rosenblatt首次提出并设计制作了著名的感知机（Perceptron），第一次从理论研究转入过程实现阶段，掀起了研究人工神经网络的高潮。今天，随着科学技术的迅猛发展，神经网络正以极大的魅力吸引着世界上众多专家、学者为之奋斗。在世

4、界范围内再次掀起了神经网络的研究热潮，难怪有关国际权威人士评论指出，目前对神经网络的研究其重要意义不亚于第二次世界大战时对原子弹的研究。,8,人工神经网络特有的非线性适应性信息处理能力，克服了传统人工智能方法对于直觉，如模式、语音识别、非结构化信息处理方面的缺陷，使之在神经专家系统、模式识别、智能控制、组合优化、预测等领域得到成功应用。人工神经网络与其他传统方法相结合，将推动人工智能和信息处理技术不断发展。近年来，人工神经网络正向模拟人类认知的道路上更加深入发展，与模糊系统、遗传算法、进化机制等结合，形成计算智能，成为人工智能的一个重要方向，将在实际应用中得到发展。,9,使用神经网络的主要优点

5、是能够自适应样本数据，当数据中有噪声、形变和非线性时，它也能够正常地工作，很容易继承现有的领域知识，使用灵活，能够处理来自多个资源和决策系统的数据；提供简单工具进行自动特征选取，产生有用的数据表示，可作为专家系统的前端（预处理器）。此外，神经网络还能提供十分快的优化过程，尤其以硬件直接实现网络时，而且可以加速联机应用程序的运行速度。当然，过分夸大神经网络的应用能力也是不恰当的，毕竞它不是无所不能的。这就需要在实际工作中具体分析问题，合理选择。,10,基于神经网络的控制称为神经网络控制（NNC），简称神经控制（NCNeurocontrol）这一新词是在国际自控联杂志自动化（Automatica）

6、1994年No.11首次使用的，最早源于1992年HTolle和EErsu的专著Neurocontrol。基于神经网络的智能模拟用于控制，是实现智能控制的一种重要形式，近年来获得了迅速发展。本节介绍神经控制的基本概念、基本结构、神经控制系统的组成及其实现神经控制和神经模糊控制的基本方法。,11,1.1 神经网络的基本概念 1.1.1 生物神经元的结构与功能特点神经生理学和神经解剖学证明了人的思维是由人脑完成的。神经元是组成人脑的最基本单元，它能够接受并处理信息，人脑大约由10111012个神经元组成，其中每个神经元约与104105个神经元通过突触连接，因此，人脑是一个复杂的信息并行加工处理巨

7、系统。探索脑组织的结构、工作原理及信息处理的机制，是整个人类面临的一项挑战，也是整个自然科学的前沿领域。,12,1生物神经元的结构生物神经元（以下简称神经元），也称神经细胞，是构成神经系统的基本单元。神经元主要由细胞体、树突和轴突构成，其基本结构如图1-1所示。,图11 生物神经元的结构,13,（1）细胞体细胞体由细胞核、细胞质与细胞膜等组成。一般直径为5100m，大小不等。细胞体是神经元的主体，它是神经元的新陈代谢中心，同时还负责接收并处理从其他神经元传递过来的信息。细胞体的内部是细胞核，外部是细胞膜，细胞膜外是许多外延的纤维，细胞膜内外有电位差，称为膜电位，膜外为正，膜内为负。,14,

8、（2）轴突轴突是由细胞体向外伸出的所有纤维中最长的一条分枝。每个神经元只有一个轴突，长度最大可达1m以上，其作用相当于神经元的输出电缆，它通过尾部分出的许多神经末梢以及梢端的突触向其他神经元输出神经冲动。,15,（3）树突树突是由细胞体向外伸出的除轴突外的其他纤维分枝，长度一般均较短，但分枝很多。它相当于神经元的输入端，用于接收从四面八方传来的神经冲动。突触是轴突的终端，是神经元之间的连接接口，每一个神经元约有104105个突触。一个神经元通过其轴突的神经末梢，经突触与另一神经元的树突连接，以实现信息的传递。,16,2生物神经元的功能特点从生物控制论的观点来看，作为控制和信息处理基本单

9、元的神经元，具有以下功能特点。（1）时空整合功能神经元对于不同时间通过同一突触传入的信息，具有时间整合功能；对于同一时间通过不同突触传入的信息，具有空间整合功能。两种功能相互结合，是使生物神经元具有时空整合的输入信息处理功能。,17,（2）动态极化性在每一种神经元中，信息都是以预知的确定方向流动的，即从神经元的接收信息部分（细胞体、树突）传到轴突的起始部分，再传到轴突终端的突触，最后再传给另一神经元。尽管不同的神经元在形状及功能上都有明显的不同，但大多数神经元都是按这一方向进行信息流动的。,18,（3）兴奋与抑制状态神经元具有两种常规工作状态，即兴奋状态与抑制状态。所谓兴奋状态是指神经

10、元对输入信息经整合后使细胞膜电位升高，且超过了动作电位的阈值，此时产生神经冲动并由轴突输出。抑制状态是指对输入信息整合后，细胞膜电位值下降到低于动作电位的阈值，从而导致无神经冲动输出。,19,（4）结构的可塑性由于突触传递信息的特性是可变的，也就是它随着神经冲动传递方式的变化，传递作用强弱不同，形成了神经元之间连接的柔性，这种特性又称为神经元结构的可塑性。（5）脉冲与电位信号的转换突触界面具有脉冲与电位信号的转换功能。沿轴突传递的电脉冲是等幅的、离散的脉冲信号，而细胞膜电位变化为连续的电位信号，这两种信号是在突触接口进行变换的。,20,（6）突触延期和不应期突触对信息的传递具有时延和不

11、应期，在相邻的两次输入之间需要一定的时间间隔，在此期间，无激励，不传递信息，这称为不应期。（7）学习、遗忘和疲劳由于神经元结构的可塑性，突触的传递作用有增强、减弱和饱和的情况。所以，神经细胞也具有相应的学习、遗忘和疲劳效应（饱和效应）。,21,1.1.2 人工神经元模型生物神经元经抽象化后，可得到如图1-2所示的一种人工神经元模型，它有三个基本要素。 1连接权连接权对应于生物神经元的突触，各个神经元之间的连接强度由连接权的权值表示，权值为正表示激活，为负表示抑制。,图1-2 基本神经元模型,22,2求和单元用于求取各输入信号的加权和（线性组合）。 3激活函数激活函数起非线

12、性映射作用，并将神经元输出幅度限制在一定范围内，一般限制在(0,1)或(-1,1)之间。激活函数也称传输函数。此外还有一个阈值k (或偏值b k= -k)。以上作用可分别以数学式表达出来：式中为输入信号，为神经元k的权值，为线性组合结果，为阈值，为激活函数，为神经元k的输出，,23,图1-2 输入扩维后的神经元模型,若把输入的维数增加一维，则可把阈值k包括进去。即此处增加了一个新的连接，其输入，权值或，如图1-2所示。激活函数，一般有以下几种形式： (1) 阶跃函数函数表达式：,24,(2)分段线性函数函数表达式： (3)Sigmoid函数最常用的Sigmo

13、id型函数为式中参数a可控制其斜率。另一种常用的Sigmoid型函数为双曲正切S型函数，即这类函数具有平滑和渐近线，并保持单调性。,25,1.1.3 神经网络的结构人工神经网络（Artificial Neural Networks，ANN）是由大量人工神经元经广泛互连而组成的，它可用来模拟脑神经系统的结构和功能。人工神经网络可以看成是以人工神经元为节点，用有向加权弧连接起来的有向图。在此有向图中，人工神经元（以下在不易引起混淆的情况下，人工神经元简称神经元）就是对生物神经元的模拟，而有向加权弧则是轴突突触树突对的模拟。有向弧的权值表示相互连接的两个人工神经元间相互作用的强弱。,26,

14、人工神经网络是生物神经网络的一种模拟和近似。它主要从两个方面进行模拟。一种是从生理结构和实现机理方面进行模拟，它涉及到生物学、生理学、心理学、物理及化学等许多基础科学。由于生物神经网络的结构和机理相当复杂，现在距离完全认识它们还相差甚远；另外一种是从功能上加以模拟，即尽量使得人工神经网络具有生物神经网络的某些功能特性，如学习、识别、控制等功能。本书仅讨论后者，从功能上来看，人工神经网络（以下简称神经网络，NN）根据连接方式主要分为两类。,27,图1-4 前馈网络,1前馈型网络前馈神经网络是整个神经网络体系中最常见的一种网络，其网络中各个神经元接受前一级的输入，并输出到下一级，网络中没有反馈

15、，如图1-4所示。节点分为两类，即输入单元和计算单元，每一计算单元可有任意个输入，但只有一个输出（它可耦合到任意多个其他节点作为输入）。,28,通常前馈网络可分为不同的层，第i层的输入只与第i-1层输出相连，输入和输出节点与外界相连，而其他中间层称为隐层，它们是一种强有力的学习系统，其结构简单而易于编程。从系统的观点看，前馈神经网络是一静态非线性映射，通过简单非线性处理的复合映射可获得复杂的非线性处理能力。但从计算的观点看，前馈神经网络并非是一种强有力的计算系统，不具备有丰富的动力学行为。大部分前馈神经网络是学习网络，并不注意系统的动力学行为，它们的分类能力和模式识别能力一般强于其他

16、类型的神经网络。,29,2反馈型网络反馈神经网络又称递归网络，或回归网络。在反馈网络中(Feedback NNs)，输入信号决定反馈系统的初始状态，然后系统经过一系列状态转移后，逐渐收敛于平衡状态。这样的平衡状态就是反馈网络经计算后输出的结果，由此可见，稳定性是反馈网络中最重要的问题之一。,图1-5 单层全连接反馈网络,30,如果能找到网络的Lyapunov函数，则能保证网络从任意的初始状态都能收敛到局部最小点。反馈神经网络中所有节点都是计算单元，同时也可接受输入，并向外界输出，可画成一个无向图，如图1-5(a)所示，其中每个连接弧都是双向的，也可画成图1-4(b)的形式。若总单元数为n，则

17、每一个节点有n-l个输入和一个输出。,31,神经网络的工作过程主要分为两个阶段：第一阶段是学习期，此时各计算单元状态不变，各连接权上的权值可通过学习来修改；第二阶段是工作期，此时各连接权固定，计算单元变化，以达到某种稳定状态。从作用效果看，前馈网络主要是函数映射，可用于模式识别和函数逼近。反馈网络按对能量函数的极小点的利用来分类有两种：第一类是能量函数的所有极小点都起作用，这一类主要用作各种联想存储器；第二类只利用全局极小点，它主要用于求解最优化问题。,1.1.4 神经网络的工作方式,32,1.1.5 神经网络的学习 1学习方式通过向环境学习获取知识并改进自身性能是神经网络的一个重要特点，

18、在一般情况下，性能的改善是按某种预定的度量调节自身参数（如权值）随时间逐步达到的，学习方式（按环境所供信息的多少分）有以下三种。,33,（1）有监督学习（有教师学习）,图1-6 有监督学习框图,这种学习方式需要外界存在一个“教师”，他可对一组给定输入提供应有的输出结果（正确答案），这组已知的输入输出数据称为训练样本集。学习系统可根据已知输出与实际输出之间的差值（误差信号）来调节系统参数，如图1-6所示。,34,在有监督学习当中，学习规则由一组描述网络行为的训练集给出： x1,t1,x1,t1, xN,tN,其中 xi为网络的输入，ti为相应的目标输出。当输入作用到网络时，网络的实际输出与目标

19、输出相比较，然后学习规则调整网络的权值和域值，从而使网络的实际输出越来越接近于目标输出。,35,（2）无监督学习（无教师学习）无监督学习时不存在外部教师，学习系统完全按照环境所提供数据的某些统计规律来调节自身参数或结构（这是一种自组织过程），以表示外部输入的某种固有特性（如聚类，或某种统计上的分布特征），如图1-7所示。在无监督学习当中，仅仅根据网络的输入调整网络的权值和域值，它没有目标输出。乍一看这种学习似乎并不可行：不知道网络的目的是什么，还能够训练网络吗？实际上，大多数这种类型的算法都是要完成某种聚类操作，学会将输入模式分为有限的几种类型。这种功能特别适合于诸如向量量化等应用问题

20、。,图1-7 无监督学习框图,36,（3）强化学习（或再励学习）,图1-8 强化学习框图,这种学习介于上述两种情况之间，外部环境对系统输出结果只给出评价（奖或罚）而不是给出正确答案，学习系统通过强化那些受奖励的动作来改善自身性能，如图1-8所示。强化学习与有监督的学习类似，只是它不像有监督的学习一样为每一个输入提供相应的目标输出，而是仅仅给出一个级别。这个级别（或评分）是对网络在某些输入序列上的性能测度。当前这种类型的学习要比有监督的学习少见。它最为适合控制系统应用领域。,37,2学习算法（1）学习规则（误差修正规则）令yi(k)为输入x(k)时神经元i在k时刻的实际输出，ti(k)

21、表示相应的期望输出，则误差信号可写为： ei(k)= ti(k) -yi(k) 误差纠正学习的最终目的是使某一基于ei(k)的目标函数达最小，以使网络中每一输出单元的实际输出在某种统计意义上最逼近于期望输出。一旦选定了目标函数形式，误差纠正学习就成为一个典型的最优化问题。,38,最常用的目标函数是均方误差判据，定义为：其中 E是统计期望算子，上式的前提是被学习的过程是宽平稳的，具体方法可用最陡梯度下降法。直接用J作为目标函数时，需要知道整个过程的统计特性，为解决这一困难用J在时刻k的瞬时值J(k)代替J，即,39,问题变为求J(k)对权值wij的极小值，根据最陡梯度下降法可得：式中，为学习

22、速率或步长（01），f()为激活函数。这就是通常说的误差纠正学习规则（或称规则），用于控制每次误差修正值。它是基于使输出方差最小的思想而建立的。,40,（2）Hebb学习神经心理学家Hebb提出的学习规则可归结为“当某一突触（连接）两端的神经元的激活同步（同为激活或同为抑制）时，该连接的强度应增加，反之则应减弱”，用数学方式可描述为：式中yi(k)，xj(k)分别为wij两端神经元的状态，其中最常用的一种情况为：式中为学习速率。由于wij(k)与yi(k)，xj(k)的相关成比例，有时称之为相关学习规则。上式定义的Hebb规则实际上是一种无监督的学习规则，因它不需要关于目标输出的任何相

23、关信息。,41,原始的Hebb学习规则对权值矩阵的取值未做任何限制，因而学习后权值可取任意值。为了克服这一弊病，在Hebb学习规则的基础上增加一个衰减项，即衰减项的加入能够增加网络学习的“记忆”功能，并且能够有效地对权值的取值加以限制。衰减系数dr的取值在0,1之间。当取0时，就变成原始的Hebb学习规则。另外，Hebb规则还可以采用有监督的学习，对于有监督学习的Hebb规则而言，将目标输出代替实际输出。由此，算法被告知的就是网络应该做什么，而不是网络当前正在做什么，可描述为：,42,Kohonen规则： Instar规则： Outstar规则：,图1-8 竞争学习网络,（3）竞争（Com

24、petitive）学习顾名思义，在竞争学习时网络各输出单元互相竞争，最后达到只有一个最强者激活。最常见的一种情况是输出神经元之间有侧向抑制性连接，如图1-8所示。这样众多输出单元中如有某一单元较强，则它将获胜并抑制其他单元，最后只有比较强者处于激活状态。最常用的竞争学习规则有以下三种：,43,图1-9 自适应学习框图,3学习与自适应当学习系统所处环境平稳时（统计特征不随时间变化），从理论上说通过监督学习可以学到环境的统计特征，这些统计特征可被学习系统（神经网络）作为经验记住。如果环境是非平稳的（统计特征随时间变化），通常的监督学习没有能力跟踪这种变化，为解决此问题需要网络有一定的自适

25、应能力，此时对每一个不同输入都作为一个新的例子对待，其工作过程如图1-9。,44,此时模型（如NN）被当作一个预测器，基于前一时刻输出x(k-1)和模型在k-1时刻的参数，它估计出k时刻的输出，与实际值x(k)（作为应有的正确答案）比较，其差值e(k)称为“新息”，如新息e(k)=0，则不修正模型参数，否则应修正模型参数以便跟踪环境的变化。,45,1.1.6 神经网络的分类神经网络根据不同的情况，可按以下几方面进行分类： (1)按功能分：连续型与离散型、确定型与随机型、静态与动态神经网络； (2)按连接方式分：前馈（或称前向）型与反馈型神经网络； (3)按逼近特性分：全局逼近型与局部

26、逼近型神经网络； (4)按学习方式分：有监督学习、无监督学习和强化学习神经网络。,46,1. 2 典型神经网络的模型自1957年F. Rosenblatt在第一届人工智能会议上展示他构造的第一个人工神经网络模型以来，据统计到目前为止已有上百种神经网络问世。根据HCC公司及IEEE的调查统计，有十多种神经网络比较著名。,47,以下按照神经网络的拓扑结构与学习算法相结合的方法，将神经网络的类型分为前馈网络、竞争网络、反馈网络和随机网络四大类，并按类介绍MP模型、感知机、自适应线性网络（Adaline）、BP网络、径向基网络、自组织竞争网络、自组织特征映射网络（SOM）、反传网络（CPN）、自适应

27、共振理论（ART）、学习向量量化(LVQ)网络、Elman网络、Hopfield网络和Boltzmann机的网络特点、拓扑结构、工作原理和学习机理，以揭示神经网络所具有的功能和特征。运用这些神经网络模型可实现函数逼近、数据聚类、模式分类、优化计算等功能。因此，神经网络广泛应用于人工智能、自动控制、机器人、统计学等领域的信息处理中。,48,1.2.1 模型 MP模型最初是由美国心理学家McCulloch和数学家Pitts在1943年共同提出的，它是有固定的结构和权组成的，它的权分为兴奋性突触权和抑制性突触权两类，如抑制性突触权被激活，则神经元被抑制，输出为零。而兴奋性突触权的数目比较多，兴奋性突

28、触权能否激活，则要看它的累加值是否大于一个阈值，大于该阈值神经元即兴奋。,49,MP模型的结构如图1-11所示,(a)早期模型 (b)具有突触的模型图1-11 MP模型中单个神经元示意图,50,式中 xej(j=1,1,n)为兴奋性突触的输入，xik(k=1,2,n)为抑制性突触的输入，则输入与输出的转换关系为,变换关系为,51,MP模型是早期提出的。在图1-11(a)中，模型的权值均为1，它可以用来完成一些逻辑性关系。如果兴奋与抑制突触用权1表示，而总的作用用加权的办法实现，兴奋为1，抑制为-1，如图1-11(b)所示，则有,52,图1-12 用MP模型实现的布尔逻辑,图1-12(a),(

29、b),(c),(d)和(e)是利用MP模型分别表示的或、与、非以及一些逻辑关系式。,53,MP模型的权值、输入和输出都是二值变量，这同由逻辑门组成的逻辑关系式的实现区别不大，又由于它的权值无法调节，因而现在很少有人单独使用。,54,1.2.2 感知机神经网络 1感知机的网络结构 1957年心理学家Frank Rosenblatt及其合作者为了研究大脑的存储、学习和认知过程而提出的一类神经网络模型，并称其为感知机（Perceptron）。感知机较MP模型又进一步，它的输入可以是非离散量，它的权不仅是非离散量，而且可以通过调整学习而得到。感知机可以对输入的样本矢量进行模式分类，而且多层的感知机，在

30、某些样本点上对函数进行逼近，但感知机是一个线性阈值单元组成的网络，在结构和算法上都成为其他前馈网络的基础，尤其它对隐单元的选取比其他非线性阈值单元组成的网络容易分析，而对感知机的讨论，可以对其他网络的分析提供依据。,55,图1-13 感知机的结构,由于感知机的权值可以通过学习调整而得到，因此它被认为是最早提出的一种神经网络模型。图1-13为感知机的两种结构。,56,在这种模型中，输入模式x=x1,x2,xMT通过各输入端点分配给下一层的各节点，下一层就是中间层，中间层可以是一层也可以是多层，最后通过输出层节点得到输出模式y=y1,y2,yLT。在这类前馈网络中没有层内连接，也没有隔层的前馈连接

31、。每一节点只能前馈联接到其下一层的所有节点。然而，对于含有隐含层的多层感知机当时没有可行的训练方法，所以初期研究的感知机为一层感知机或称为单感知机，我们通常就把它称为感知机。虽然简单感知机有其局限性，但人们对它作了深入的研究，有关它的理论仍是研究其他网络模型的基础。,57,如果在输入层和输出层单元之间加入一层或多层处理单元，即可构成多层感知机，因而多层感知机由输入层、隐含层、输出层组成。隐含层的作用相当于特征检测器，提取输入模式中包含的有效特征信息，使输出单元所处理的模式是线性可分的。但需注意，多层感知机模型只允许一层连接权值可调，这是因为无法设计出一个有效的多层感知机学习算法。,58,图1-

32、14是一个两层感知机结构（包括输入层、一个隐含层和一个输出层），有两层连接权，其中输入层和隐含层单元间的连接权值是随机设定的固定值，不可调节；输出层与隐含层单元间的连接权值是可调的。,图1-14 两层感知机,59,值得注意的是：在神经网络中由于输入层仅仅起输入信号的等值传输作用，而不对信号进行运算，故在定义多少层神经网络时，一般不把输入层计算在内，如上所述。也就是说一般把隐含层称为神经网络的第一层，输出层称为神经网络的第二层（假如只有一个隐含层）。如果有两个隐含层，则第一个隐含层称为神经网络的第一层，第二个隐含层称为神经网络的第二层，而输出层称为神经网络的第三层。如果有多个隐含层，依次类推。在

33、MATLAB神经网络工具箱中的定义也类同。,60,感知机神经元网络是由hardlim产生的符号函数阈值元件组成的。对于具有M个输入、L个输出的单层感知机网络，如图1-12(a)所示。该网络通过一组权值wij(i=1,2, L；j=1,2, M)与L个神经元组成。根据结构图，可以写出，输出层的第i个神经元的输入总和（即激活函数）和输出分别为 (i=1,2, L) (1-1) 式中 i 为输出层神经元i的阈值，M为输入层的节点数，即输入的个数。f(.)为激活函数。感知机中的激活函数使用了阶跃限幅函数，因此感知机能够将输入向量分为两个区域，即有,61,2感知机学习感知机的学习是典型的有教师学习，可

34、以通过样本训练达到学习的目的。训练的条件有两个：训练集和训练规则。感知机的训练集就是由若干个输入输出模式对构成的一个集合，所谓输入输出模式对是指一个输入模式及其期望输出模式所组成的向量对。它包括二进制值输入模式及其期望输出模式，每个输出对应一个分类。F. Rosenblatt业已证明，如果两类模式是线性可分的（指存在一个超平面将它们分开），则算法一定收敛。,62,设有N个训练样本，在感知机训练期间，不断用训练集中的每个模式对训练网络。当给定某一个样本p的输入输出模式对时，感知机输出单元会产生一个实际输出向量，用期望输出与实际的输出之差来修正网络连接权值。权值的修正采用简单的学习规则，它是一个有

35、教师的学习过程，其基本思想是利用某个神经单元的期望输出与实际的输出之间的差来调整该神经单元与上一层中相应神经单元的连接权值，最终减小这种偏差。也就是说，神经单元之间连接权的变化正比于输出单元期望输出与实际的输出之差。,63,简单感知机输出层的任意神经元i的连接权值wij和阈值i修正公式为 (i=1,2, L；j=1,2,M) (1-2) (i=1,2, L) (1-3) 式中表示在样本p作用下的第i个神经元的期望输出，表示在样本p作用下的第i个神经元的实际输出。为学习速率（01），用于控制权值调整速度。学习速率较大时，学习过程加速，网络收敛较快。但是太大时，学习过程变得不稳定，且误差会加

36、大。因此学习速率的取值很关键。,64,感知机的学习规则属误差修正规则，该法已被证明，经过若干次叠代计算后，可以收敛到正确的目标向量。由上可知，该算法无需求导数，因此比较简单，又具有收敛速度快和精度高的优点。期望输出与实际输出之差为 (1-4),由此可见，权值变化量与两个量有关；输入状态xj和输出误差。当且仅当输出单元i有输出误差且相连输入状态xj为l时，修正权值或增加一个量或减少一个量。,65,感知机的学习过程又称为最小方差学习过程。根据权向量分布，可以构造一个多维权空间，其中，每个权对应一个轴，另一个轴表示学习过程中的误差度量。由于对每个权向量都会有一定输出误差，由权空间某点的“高度”表示

37、。学习过程中所有这些点形成的一个空间表面，称为误差表面。线性输出单元的感知机，其误差表面成一碗形，其水平截线为椭圆，垂直截线为抛物线。显然，该碗形表面只有一个极小点，沿误差表面按梯度下降法就能达到该点，这涉及感知机学习的收敛性，下面还要详细讨论。,66,3感知机的线性可分性感知机可以对线性可分性输入模式进行分类，例如，两维输入x1,x2。其分界线为n-1维（2-1=l）直线，则w1x1+w2x2 =0 根据式(1-1)可知，当且仅当w1x1+w2x2 时，y=1，此时把输入模式划分为“1”类，用“”代表输出为1的输入模式，即目标输出为1的两个输入向量用黑心圆圈“”表示；当且仅当w1x1+w2

38、x2 时，y=0，此时把输入模式划分为“0”类，用“”代表输出为0的输入模式，即目标输出为0的两个输入向量用空心圆圈“”表示，其对应的线性分割如图1-15所示。,67,所以感知机对与、或、非问题均可以线性分割。感知机模式只能对线性输入模式进行分类，这是它的主要功能局限。,图1-15 线性分割图,68,例1-1 利用简单感知机对“与”、“或”和“异或”问题进行分类。解：逻辑“与”、“或” 和“异或”的真值表如表1-1所示。,表1-1 真值表,69,对于逻辑“与”和逻辑“或”可将输入模式按照其输出分成两类，输出为0的属于“0”类，用“”代表；输出为1的属于“1”类，用“”代表，如图1-16(a)

39、,(b)所示。输入模式可以用一条决策直线划分为两类，即逻辑“与”和逻辑“或”是线性可分的。所以简单感知机可以解决逻辑“与”和逻辑“或”的问题。,图1-16 AND,OR和XOR输入模式的空间分布,70,对于逻辑“异或”现仍然将输入模式按照其输出分成两类。即这四个输入模式分布在二维空间中，如图1-16(c)所示。显然无法用一条决策直线把这四个输入模式分成两类，即逻辑“异或”是线性不可分的。所以简单感知机无法解决逻辑“异或”问题。感知机为解决逻辑异或问题，可以设计一个多层的网络，即含有输入层，隐含层和输出层的结构。可以证明，只要隐含层单元数足够多，用多层感知机网络可实现任何模型分类。但是，隐单

40、元的状态不受外界直接控制，这给多层网络的学习带来极大困难。,71,4感知机收敛性定理定理1.1如果样本输入函数是线性可分的，那么感知机学习算法经过有限次迭代后可收敛到正确的权值或权向量。定理1.2假定隐含层单元可以根据需要自由设置，那么用双隐含层感知机可以实现任意的二值逻辑函数。,72,5感知机网络学习算法的计算步骤 (1) 初始化：置所有的加权系数为最小的随机数； (2) 提供训练集：给出顺序赋值的输入向量x1,x2,xM和期望的输出向量（训练集）t1,t2,tL； (3) 计算实际输出：按式(1-1)计算输出层各神经元的输出； (4) 按式(1-4)计算期望值与实际输出的误差； (5)

41、按式(1-2)和式(1-3)调整输出层的的加权系数wij和阈值i。返回计算(3)步，直到误差满足要求为止。,73,1.2.3 自适应线性神经网络线性神经网络是一种简单的神经元网络，它可以由一个或多个线性神经元构成。1962年由美国斯坦福大学教授Berhard Widrow提出的自适应线性元件网络（Adaptive Linear Element，Adaline）是线性神经网络最早的典型代表，它是一个由输入层和输出层构成的单层前馈型网络。它与感知机神经网络的不同之处在于其每个神经元的传输函数为线性函数，因此自适应线性神经网络的输出可以取任意值，而感知机神经网络的输出只能是1或0。,74,线性

42、神经网络采用由Berhard Widrow和Marcian Hoff共同提出的一种新的学习规则，也称为 WidrowHoff学习规则，或者LMS（Least Mean Square）算法来调整网络的权值和阈值。自适应线性神经网络的学习算法比感知机网络的学习算法的收敛速度和精度都有较大的提高。,75,自适应线性神经网络主要用于函数逼近、信号预测、系统辨识、模式识别和控制等领域。 1线性神经网络结构线性神经网络结构同感知机，不同之处在于其每个神经元的传输函数为线性函数。对于具有M个输入、L个输出的线性神经网络。输出层的第i个神经元的输入总和（即激活函数）和输出分别为 (i=1,2, L) (1-

43、5) 式中 i 为输出层神经元i的阈值，M为输入层的节点数，即输入的个数。f(.)为激活函数，它为线性函数的传输函数。,76,2线性神经网络的学习线性神经网络的学习也是典型的有导师学习，采用 WidrowHoff学习规则,即LMS学习规则。在训练期间，不断用训练集中的每个模式对训练网络。当给定某一训练模式时，输出单元会产生一个实际输出向量，用期望输出与实际的输出之差来修正网络联接权值。在训练网络的学习阶段，设有N个训练样本，先假定用其中的某一个样本p的输入输出模式对Xp和Tp对网络进行训练，输出层的第i个神经元在样本p作用下的输入为： (i=1,2,., L) 式中 i为输出层神经元i的阈

44、值，M为输入层的节点数，即输入的个数。,77,输出层第i个神经元的输出为： (i=1,2, L) 式中 f(.)为线性激活函数。它将网络的输入原封不动地输出，因此有 (i=1,2,., L) (1-6) 对于每一样本p的输入模式对的二次型误差函数为 (1-7) 则系统对所有N个训练样本的总误差函数为 (1-8) 式中 N为模式样本对数；L为网络输出节点数；表示在样本p作用下的第i个神经元的期望输出，表示在样本p作用下的第i个神经元的实际输出。,78,线性神经网络加权系数修正是采用Widrow-Hoff学习规则，又称为最小均方误差算法（LMS）。它的实质是利用梯度最速下降法，是权值沿误差函数

45、的负梯度方向改变。Widrow-Hoff学习规则的权值变化量正比于网络的输出误差及网络的输入矢量。根据梯度法，可得输出层的任意神经元i的加权系数修正公式为 (i=1,2,., L；j=1,2, M) 式中学习速率为常值，当时，可使算法收敛。随着输入样本Xp自适应地调整。,79,因为定义则由于激活函数f(.)为线性函数，故：所以,80,可得输出层的任意神经元i的加权系数修正公式为 (1-9),同理，阈值i的修正公式为 (1-10) 以上两式构成了最小均方误差算法（LMS），或Widrow-Hoff学习算法，它实际上也是学习规则的一种特例。,81,3线性神经网络学习算法的计算步骤

46、 (1)初始化：置所有的加权系数为最小的随机数； (2)提供训练集：给出顺序赋值的输入向量x1,x2,xM和期望的输出向量（训练集）t1,t2,tL； (3)计算实际输出：按式(1-5)和式(1-6)计算输出层各神经元的输出。 (4)按式(1-7)或式(1-8)计算期望值与实际输出的误差。 (5)按式(1-9)和式(1-10)调整输出层的的加权系数wij和阈值i。返回计算(3)步，直到误差满足要求为止。,82,1.2.4 BP神经网络 1986年D.E.Rumelhart和J.L.McClelland提出了一种利用误差反向传播训练算法的神经网络，简称BP(Back Propogation)网

47、络，是一种有隐含层的多层前馈网络，系统地解决了多层网络中隐含单元连接权的学习问题。如果网络的输入节点数为M、输出节点数为L，则此神经网络可看成是从M维欧氏空间到L维欧氏空间的映射。这种映射是高度非线性的。,83,其主要用于：模式识别与分类：用于语言、文字、图像的识别，医学特征的分类和诊断等。函数逼近：用于非线性控制系统的建模、机器人的轨迹控制及其他工业控制等。数据压缩：编码压缩和恢复，图像数据的压缩和存储，以及图像特征的抽取等。,84,1BP算法原理 BP学习算法的基本原理是梯度最速下降法，它的中心思想是调整权值使网络总误差最小。也就是采用梯度搜索技术，以期使网络的实际输出值与期望输出

48、值的误差均方值为最小。网络学习过程是一种误差边向后传播边修正权系数的过程。,85,多层网络运行BP学习算法时，实际上包含了正向和反向传播两个阶段。在正向传播过程中，输入信息从输入层经隐含层逐层处理，并传向输出层，每一层神经元的状态只影响下一层神经元的状态。如果在输出层不能得到期望输出，则转入反向传播，将误差信号沿原来的连接通道返回，通过修改各层神经元的权值，使误差信号最小。,86,将一层节点的输出传送到另一层时，通过调整连接权系数wij来达到增强或削弱这些输出的作用。除了输入层的节点外，隐含层和输出层节点的净输入是前一层节点输出的加权和。每个节点的激活程度由它的输入信号、激活函数和节点的偏置（或阈值）来决定。但对于输入层输入模式送到输入层节点上，这一层节点的输出即等于其输入。注意，这种网络没有反馈存在，实际运行仍是单向的，所以不能将其看成是一非线性动力学系统，而只是一种非线性映射关系。,87,具有隐含层BP网络的结构图如图1-17所示，图中设有M个输入节点x1、x2、xM。L个输出节点y1,y2、yL，网络的隐含层共有q个神经元。,图1-17 BP网络,88,BP网络结构与多层感知机结构图相比，二者是类似的，但差异也是显著的。首先，多层感知机结构中只有一层权值可调，其他各层权值是固定的、不可学习的；BP网络的每一层连接权值都可通过学

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

20 元

下载	加入VIP免费专享

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 神经网络控制理论

三一文库所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

关于本文

本文标题：第1章神经网络控制理论.ppt
链接地址：https://www.31doc.com/p-2597956.html