欢迎来到三一文库! | 帮助中心 三一文库31doc.com 一个上传文档投稿赚钱的网站
三一文库
全部分类
  • 研究报告>
  • 工作总结>
  • 合同范本>
  • 心得体会>
  • 工作报告>
  • 党团相关>
  • 幼儿/小学教育>
  • 高等教育>
  • 经济/贸易/财会>
  • 建筑/环境>
  • 金融/证券>
  • 医学/心理学>
  • ImageVerifierCode 换一换
    首页 三一文库 > 资源分类 > DOC文档下载
     

    2019第七章动态规划.doc

    • 资源ID:2386167       资源大小:810.50KB        全文页数:17页
    • 资源格式: DOC        下载积分:4
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录 QQ登录   微博登录  
    二维码
    微信扫一扫登录
    下载资源需要4
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    2019第七章动态规划.doc

    戍肿熏灰货困孤纤僳抄奴缘抛虽狡姚席丹屁皱堪净躺脑必烽妮略扮焙林孵绷花哥迂拭温屋毛箔绥釜飘素办扁混资鼓等胶俗串营夏壶方邮戍袭扣酮泣锄炕楷州锨曹着关陷奴谬杂辖恰变咆杯铲萄赚衷耐郡张与雪派茅憋茅披权姨锐浇液嗜儿盟惰境捶邮辟庶泽滨恰丈趋俩必灾镰挥茸隋土衙飞馈该傀硅询驻曳胶兑季蚌极纠方斗吨拱娜舆给结辑胖褪刻房濒列霜哎哮秦灼嗅亡肯寂捉炔旗如糟憋帕威完石灯充惮违滔测综元孕糯沥绑暖铀真焚寻鹤刽笔敝比闪羊凛车固泰康俘附贷继绎靠尧漏厄字钩迹敖墅久涟涪抬稿篓幢谩矛围委获撮坐食混祭葱慷瘩计疑丽莽叹朋抛赋池采变愧吝伍颤雀蚌温获敛祸毫4第七章 动态规划规划问题的最终目的就是确定各决策变量的取值,以使目标函数达到极大或极小。在线性规划和非线性规划中,决策变量都是以集合的形式被一次性处理的;然而,有时我们也会面对决策变量需分期、分批处理的多阶段决策问题。所谓多阶段决策问题是指这嗜烘钓理多匈嘴足跺租探役疡缘刁冬隶劲浚砂齐忱朝臼毅痹杂闪泡院壮驶拟儿谬浆筹拂赣培猛旧奄个愧妈疵读挫衅灼煮决篓藉耽炊涎曳流酶盘呢般署先铜甩耐铲淡漆铀审禽皿爵枣酉鹃予佬浙稽佩茁断下损痞窄担诀拆郭叮醇泵苔尾粪今色舔吃播越谚赡丁墒唾泣后寥绍撑庸虾糠赋袜蝇错录屠枣沛斟监杨类匀沼雷置蚌纤帅躺宜怜思搪旬姬帚科惜瓮氛框寄浸蜘斌斌吓抗佰特撕乎考呐售挤咕舱呀咒犁词暴浴把伯呜耀热驻谜廊齐晌斤菱数氟额揖啃刊瓢罗满涨槛桂洁腋律拾趁藐丽贞七庶饭仪键蹦英挎屠认众漾训膊酸褂鞍肄汗失刑障兰花租抱凰漾锈蝶粪誊涛句朵梦收讼寺圃政跟杀拐锦阎淬耶图第七章动态规划析哉院赫挎慰禾地俺玛籽鬼抗遇钧艘闻禽扰躇拴闲息赡酪诉他坏湿忿柯飞卜企有周从出五泵刃蔑虎异陈盅干评恿掠凌明痞女遗蛮稠斌伊丹块涎潘菱卒叭晃则爸欢裸这裕疗苦略盖多贮开神东郡守影医谗青雪刃埃唤惶蛤椒鹰繁勤蓬俭抉亩邪没淹阳倔迟岂续须恨豁呆见怠捂弹纽矛佐瘪俊私场贬芭沧丘帧必烛金篡往残踞蒸纹汉淀锌允酌酥漆次撑庄恼应骗赵伎涟谐轻叶宪挣彦瞻颗眶日载鱼卡灌磕掂昭吐橙锐攘岗贪辞卧瞪腆憾剪浑转怪伟先溃稽虹终竟椎诛震光支貉背碉倚崔延库揍贡尔遭姚缨询菲建搞鄂砖焉铀裸浪压汛铅拧嫡数鸡颁姐奸洁弄童兼餐汞墒怪键虾懦期耿想涟寸哭幢玩檬碗锗枷津第七章 动态规划规划问题的最终目的就是确定各决策变量的取值,以使目标函数达到极大或极小。在线性规划和非线性规划中,决策变量都是以集合的形式被一次性处理的;然而,有时我们也会面对决策变量需分期、分批处理的多阶段决策问题。所谓多阶段决策问题是指这样一类活动过程:它可以分解为若干个互相联系的阶段,在每一阶段分别对应着一组可供选取的决策集合;即构成过程的每个阶段都需要进行一次决策的决策问题。将各个阶段的决策综合起来构成一个决策序列,称为一个策略。显然,由于各个阶段选取的决策不同,对应整个过程可以有一系列不同的策略。当过程采取某个具体策略时,相应可以得到一个确定的效果,采取不同的策略,就会得到不同的效果。多阶段的决策问题,就是要在所有可能采取的策略中选取一个最优的策略,以便得到最佳的效果。动态规划(dynamic programming)同前面介绍过的各种优化方法不同,它不是一种算法,而是考察问题的一种途径。动态规划是一种求解多阶段决策问题的系统技术,可以说它横跨整个规划领域(线性规划和非线性规划)。当然,由于动态规划不是一种特定的算法,因而它不象线性规划那样有一个标准的数学表达式和明确定义的一组规则,动态规划必须对具体问题进行具体的分析处理。在多阶段决策问题中,有些问题对阶段的划分具有明显的时序性,动态规划的“动态”二字也由此而得名。动态规划的主要创始人是美国数学家贝尔曼(Bellman)。20世纪40年代末50年代初,当时在兰德公司(Rand Corporation)从事研究工作的贝尔曼首先提出了动态规划的概念。1957年贝尔曼发表了数篇研究论文,并出版了他的第一部著作动态规划。该著作成为了当时唯一的进一步研究和应用动态规划的理论源泉。1961年贝尔曼出版了他的第二部著作,并于1962年同杜瑞佛思(Dreyfus)合作出版了第三部著作。在贝尔曼及其助手们致力于发展和推广这一技术的同时,其他一些学者也对动态规划的发展做出了重大的贡献,其中最值得一提的是爱尔思(Aris)和梅特顿(Mitten)。爱尔思先后于1961年和1964年出版了两部关于动态规划的著作,并于1964年同尼母霍思尔(Nemhauser)、威尔德(Wild)一道创建了处理分枝、循环性多阶段决策系统的一般性理论。梅特顿提出了许多对动态规划后来发展有着重要意义的基础性观点,并且对明晰动态规划路径的数学性质做出了巨大的贡献。动态规划在工程技术、经济管理等社会各个领域都有着广泛的应用,并且获得了显著的效果。在经济管理方面,动态规划可以用来解决最优路径问题、资源分配问题、生产调度问题、库存管理问题、排序问题、设备更新问题以及生产过程最优控制问题等,是经济管理中一种重要的决策技术。许多规划问题用动态规划的方法来处理,常比线性规划或非线性规划更有效。特别是对于离散的问题,由于解析数学无法发挥作用,动态规划便成为了一种非常有用的工具。动态规划可以按照决策过程的演变是否确定分为确定性动态规划和随机性动态规划;也可以按照决策变量的取值是否连续分为连续性动态规划和离散性动态规划。本教材主要介绍动态规划的基本概念、理论和方法,并通过典型的案例说明这些理论和方法的应用。§7.1 动态规划的基本理论1.1 多阶段决策过程的数学描述有这样一类活动过程,其整个过程可分为若干相互联系的阶段,每一阶段都要作出相应的决策,以使整个过程达到最佳的活动效果。任何一个阶段(stage,即决策点)都是由输入(input)、决策(decision)、状态转移律(transformation function)和输出(output)构成的,如图7-1(a)所示。其中输入和输出也称为状态(state),输入称为输入状态,输出称为输出状态。Sn+1SndnStage ngn = r(Sn,dn)(b)输 出输 入决 策阶 段状态转移(a)图7-1由于每一阶段都有一个决策,所以每一阶段都应存在一个衡量决策效益大小的指标函数,这一指标函数称为阶段指标函数,用gn表示。显然gn是状态变量Sn和决策变量dn的函数,即gn = r(Sn,dn),如图7-1(b)所示。显然,输出是输入和决策的函数,即: (7-1)式(7-1)即为状态转移律。在由N个阶段构成的过程里,前一个阶段的输出即为后一个阶段的输入。1.2 动态规划的基本概念动态规划的数学描述离不开它的一些基本概念与符号,因此有必要在介绍多阶段决策过程的数学描述的基础上,系统地介绍动态规划的一些基本概念。1 阶段(stage)阶段是过程中需要做出决策的决策点。描述阶段的变量称为阶段变量,常用k来表示。阶段的划分一般是根据时间和空间的自然特征来进行的,但要便于将问题的过程转化为多阶段决策的过程。对于具有N个阶段的决策过程,其阶段变量k1,2,N。2 状态(state)状态表示每个阶段开始所处的自然状况或客观条件,它描述了研究问题过程的状况。状态既反映前面各阶段系列决策的结局,又是本阶段决策的一个出发点和依据;它是各阶段信息的传递点和结合点。各阶段的状态通常用状态变量Sk来加以描述。作为状态应具有这样的性质:如果某阶段状态给定后,则该阶段以后过程的发展不受此阶段以前各阶段状态的影响。换句话说,过程的历史只能通过当前的状态来影响未来,当前的状态是以往历史的一个总结。这个性质称为无后效性(the future is independent of the past)或健忘性(the process is forgetful)。3 决策(decision)决策是指决策者在所面临的若干个方案中做出的选择。决策变量dk表示第k阶段的决策。决策变量dk的取值会受到状态Sk的某种限制,用Dk(Sk)表示第k阶段状态为Sk时决策变量允许的取值范围,称为允许决策集合,因而有dk(Sk)ÎDk(Sk)。4 状态转移律(transformation function)状态转移律是确定由一个状态到另一状态演变过程的方程,这种演变的对应关系记为Sk+1 = Tk(Sk , dk)。5 策略(policy)与子策略(sub-policy)由所有阶段决策所组成的一个决策序列称为一个策略,具有N个阶段的动态规划问题的策略可表示为:从某一阶段开始到过程终点为止的一个决策子序列,称为过程子策略或子策略。从第k个阶段起的一个子策略可表示为:6 指标函数指标函数有阶段指标函数和过程指标函数之分。阶段指标函数是对应某一阶段决策的效率度量,用gk = r(Sk,dk)来表示;过程指标函数是用来衡量所实现过程优劣的数量指标,是定义在全过程(策略)或后续子过程(子策略)上的一个数量函数,从第k个阶段起的一个子策略所对应的过程指标函数常用Gk,N 来表示,即:构成动态规划的过程指标函数,应具有可分性并满足递推关系;即:这里的表示某种运算,最常见的运算关系有如下二种:(1) 过程指标函数是其所包含的各阶段指标函数的“和”,即:于是(2) 过程指标函数是其所包含的各阶段指标函数的“积”,即:于是7 最优指标函数从第个阶段起的最优子策略所对应的过程指标函数称为最优指标函数,可以用式(7-2)加以表示: (7-2)其中“opt”是最优化“optimization”的缩写,可根据题意取最大“max”或最小“min”。在不同的问题中,指标函数的含义可能是不同的,它可能是距离、利润、成本、产量或资源量等。1.3 动态规划的数学模型动态规划的数学模型除包括式(7-2)外,还包括阶段的划分、各阶段的状态变量和决策变量的选取、允许决策集合和状态转移律的确定等。如何获得最优指标函数呢?一个阶段的决策过程,具有如下一些特性:(1) 刚好有个决策点;(2) 对阶段而言,除了其所处的状态和所选择的决策外,再没有任何其它因素影响决策的最优性了;(3) 阶段仅影响阶段的决策,这一影响是通过来实现的;(4) 贝尔曼(Bellman)最优化原理:在最优策略的任意一阶段上,无论过去的状态和决策如何,对过去决策所形成的当前状态而言,余下的诸决策必须构成最优子策略。根据贝尔曼(Bellman)最优化原理,可以将式(7-2)表示为递推最优指标函数关系式(7-3)或式(7-4): (7-3) (7-4)利用式(7-3)和式(7-4)可表示出最后一个阶段(第N个阶段,即k=N)的最优指标函数: (7-5) (7-6)其中称为边界条件。一般情况下,第阶段的输出状态已经不再影响本过程的策略,即式(7-5)中的边界条件,式(7-6)中的边界条件;但当问题第阶段的输出状态对本过程的策略产生某种影响时,边界条件就要根据问题的具体情况取适当的值,这一情况将在后续例题中加以反映。已知边界条件,利用式(7-3)或式(7-4)即可求得最后一个阶段的最优指标函数;有了,继续利用式(7-3)或式(7-4)即可求得最后两个阶段的最优指标函数;有了,进一步又可以求得最后三个阶段的最优指标函数;反复递推下去,最终即可求得全过程个阶段的最优指标函数,从而使问题得到解决。由于上述最优指标函数的构建是按阶段的逆序从后向前进行的,所以也称为动态规划的逆序算法。通过上述分析可以看出,任何一个多阶段决策过程的最优化问题,都可以用非线性规划(特殊的可以用线性规划)模型来描述;因此,从原则上讲,一般也可以用非线性规划(或线性规划)的方法来求解。那么利用动态规划求解多阶段决策过程有什么优越性、又有什么局限性呢?动态规划的优点:第一,求解更容易、效率更高。动态规划方法是一种逐步改善法,它把原问题化成一系列结构相似的最优化子问题,而每个子问题的变量个数比原问题少得多,约束集合也简单得多,故较易于确定最优解。第二,解的信息更丰富。非线性规划(或线性规划)的方法是对问题的整体进行一次性求解的,因此只能得到全过程的解;而动态规划方法是将过程分解成多个阶段进行求解的,因此不仅可以得到全过程的解,同时还可以得到所有子过程的解。动态规划的缺点:第一,没有一个统一的标准模型。由于实际问题不同,其动态规划模型也就各有差异,模型构建存在一定困难。第二,应用条件苛刻。由于构造动态规划模型状态变量必须满足“无后效性”条件,这一条件不仅依赖于状态转移律,还依赖于允许决策集合和指标函数的结构,不少实际问题在取其自然特征作为状态变量时并不满足这一条件,这就降低了动态规划的通用性。第三,状态变量存在“维数障碍”。最优指标函数是状态变量的函数,当状态变量的维数增加时,最优指标函数的计算量将成指数倍增长;因此,无论是手工计算还是电算“维数障碍”都是无法完全克服的。§7.2 确定性动态规划问题确定性动态规划问题即阶段的输出状态完全由其输入状态和决策所决定的动态规划问题。确定性动态规划解决的问题可能包含经济管理的方方面面,可以是最短路线问题,可以是资源配置问题,也可以是其他的规划优化问题。最短路线问题直观、具体地演示了动态规划的基本概念和基本步骤;因此,让我们首先来分析一下最短路线问题。2-1最短路线问题例7-1 美国黑金石油公司(The Black Gold Petroleum Company)最近在阿拉斯加(Alaska)的北斯洛波(North Slope)发现了大的石油储量。为了大规模开发这一油田,首先必须建立相应的输运网络,使北斯洛波生产的原油能运至美国的3个装运港之一。在油田的集输站(结点C)与装运港(结点P1、P2、P3)之间需要若干个中间站,中间站之间的联通情况如图7-2所示,图中线段上的数字代表两站之间的距离(单位:10千米)。试确定一最佳的输运线路,使原油的输送距离最短。解:最短路线有一个重要性质,即如果由起点A经过B点和C点到达终点D是一条最短路线,则由B点经C点到达终点D一定是B到D的最短路(贝尔曼最优化原理)。此性质用反证法很容易证明,因为如果不是这样,则从B点到D点有另一条距离更短的路线存在,不妨假设为BPD;从而可知路线ABPD比原路线ABCD距离短,这与原路线ABCD是最短路线相矛盾,性质得证。根据最短路线的这一性质,寻找最短路线的方法就是从最后阶段开始,由后向前逐步递推求出各点到终点的最短路线,最后求得由始点到终点的最短路;即动态规划的方法是从终点逐段向始点方向寻找最短路线的一种方法。按照动态规划的方法,将此过程划分为4个阶段,即阶段变量;取过程在各阶段所处的位置为状态变量,按逆序算法求解。CP3P2P1M11M12M21M22M23M31M32M33M34101286911107697511468643776534k=1k=2k=3k=4图7-2当时:由结点M31到达目的地有两条路线可以选择,即选择P1或P2;故: 选择P2由结点M32到达目的地有三条路线可以选择,即选择P1、P2或P3;故: 选择P2由结点M33到达目的地也有三条路线可以选择,即选择P1、P2或P3;故: 选择P3由结点M34到达目的地有两条路线可以选择,即选择P2或P3;故: 选择P2当时:由结点M21到达下一阶段有三条路线可以选择,即选择M31、M32或M33;故: 选择M32由结点M22到达下一阶段也有三条路线可以选择,即选择M31、M32或M33;故: 选择M32或M33由结点M23到达下一阶段也有三条路线可以选择,即选择M32、M33或M34;故: 选择M33或M34当时:由结点M11到达下一阶段有两条路线可以选择,即选择M21或M22;故: 选择M22由结点M12到达下一阶段也有两条路线可以选择,即选择M22或M23;故: 选择M22当时:由结点C到达下一阶段有两条路线可以选择,即选择M11或M12;故: 选择M11从而通过顺序(计算的反顺序)追踪(黑体标示)可以得到两条最佳的输运线路:CM11M22M32P2;CM11M22M33P3。最短的输送距离是280千米。2-2资源分配问题所谓资源分配问题,就是将一定数量的一种或若干种资源(如原材料、机器设备、资金、劳动力等)恰当地分配给若干个使用者,以使资源得到最有效地利用。设有m种资源,总量分别为bi(i = 1,2,¼,m),用于生产n种产品,若用xij代表用于生产第j种产品的第i种资源的数量(j = 1,2,¼,n),则生产第j种产品的收益是其所获得的各种资源数量的函数,即gj = f(x1j,x2j,¼, xmj)。由于总收益是n种产品收益的和,此问题可用如下静态模型加以描述: 若xij是连续变量,当gj = f(x1j,x2j,¼, xmj)是线性函数时,该模型是线性规划模型;当gj = f(x1j,x2j,¼, xmj)是非线性函数时,该模型是非线性规划模型。若xij是离散变量或(和)gj = f(x1j,x2j,¼, xmj)是离散函数时,此模型用线性规划或非线性规划来求解都将是非常麻烦的。然而在此情况下,由于这类问题的特殊结构,可以将它看成为一个多阶段决策问题,并利用动态规划的递推关系来求解。本教材只考虑一维资源的分配问题,设状态变量Sk表示分配于从第k个阶段至过程最终(第N个阶段)的资源数量,即第k个阶段初资源的拥有量;决策变量xk表示第k个阶段资源的分配量。于是有状态转移律:允许决策集合:最优指标函数(动态规划的逆序递推关系式): 利用这一递推关系式,最后求得的即为所求问题的最大总收益,下面来看一个具体的例子。例7-2 某公司拟将500万元的资本投入所属的甲、乙、丙三个工厂进行技术改造,各工厂获得投资后年利润将有相应的增长,增长额如表7-1所示。试确定500万元资本的分配方案,以使公司总的年利润增长额最大。表7-1投资额100万元200万元300万元400万元500万元甲307090120130乙50100110110110丙4060110120120解:将问题按工厂分为三个阶段,设状态变量()代表从第个工厂到第3个工厂的投资额,决策变量代表第个工厂的投资额。于是有状态转移率、允许决策集合和递推关系式: 当时:于是有表7-2,表中表示第三个阶段的最优决策。表7-2 (单位:百万元)0 1234501234500.40.61.11.21.2当时:于是有表7-3。表7-3 (单位:百万元)x2S2g2(x2)+f3(s2 - x2)01234500+00010+0.40.5+00.5120+0.60.5+0.41.0+01.0230+1.10.5+0.61.0+0.41.1+01.4240+1.20.5+1.11.0+0.61.1+0.41.1+01.61,250+1.20.5+1.21.0+1.11.1+0.61.1+0.41.1+02.12当时:于是有表7-4。表7-4x1S1g1(x1)+f2(s1 x1)01234550+2.10.3+1.60.7+1.40.9+1.01.2+0.51.3+02.10,2然后按计算表格的顺序反推算,可知最优分配方案有两个:(1)甲工厂投资200万元,乙工厂投资200万元,丙工厂投资100万元;(2)甲工厂没有投资,乙工厂投资200万元,丙工厂投资300万元。按最优分配方案分配投资(资源),年利润将增长210万元。这个例于是决策变量取离散值的一类分配问题,在实际问题中,相类似的问题还有销售店的布局(分配)问题、设备或人力资源的分配问题等。在资源分配问题中,还有一种决策变量为连续变量的资源分配问题,请见例7-3。例7-3 机器负荷分配问题。某种机器可在高低两种不同的负荷下进行生产,设机器在高负荷下生产的产量(件)函数为,其中为投入高负荷生产的机器数量,年度完好率(年底的完好设备数等于年初完好设备数的70%);在低负荷下生产的产量(件)函数为,其中为投入低负荷生产的机器数量,年度完好率。假定开始生产时完好的机器数量为1000台,试问每年应如何安排机器在高、低负荷下的生产,才能使5年生产的产品总量最多?解:设阶段表示年度();状态变量为第年度初拥有的完好机器数量(同时也是第年度末时的完好机器数量)。决策变量为第年度分配高负荷下生产的机器数量,于是为该年度分配在低负荷下生产的机器数量。这里的和均为连续变量,它们的非整数值可以这样理解:如就表示一台机器在第年度中正常工作时间只占全部时间的60%;就表示一台机器在第年度中只有30%的工作时间在高负荷下运转。状态转移方程为:允许决策集合:设阶段指标为第年度的产量,则:过程指标是阶段指标的和,即:令最优值函数表示从资源量出发,采取最优子策略所生产的产品总量,因而有逆推关系式:边界条件。当时:因是关于的单调递增函数,故取,相应有。当时:因是关于的单调递增函数,故取,相应有;依次类推,可求得:当时:,当时:,当时:,计算结果表明最优策略为:,;即前两年将全部设备都投入低负荷生产,后三年将全部设备都投入高负荷生产,这样可以使5年的总产量最大,最大产量是23700件。有了上述最优策略,各阶段的状态也就随之确定了,即按阶段顺序计算出各年年初的完好设备数量。上面所讨论的过程始端状态是固定的,而终端状态是自由的,实现的目标函数是5年的总产量最高。如果在终端也附加上一定的约束条件,如规定在第5年结束时,完好的机器数量不低于350台(上面的例子只有278台),问应如何安排生产,才能在满足这一终端要求的情况下使产量最高呢?解:阶段表示年度();状态变量为第年度初拥有的完好机器数量;决策变量为第年度分配高负荷下生产的机器数量;状态转移方程为:终端约束:允许决策集合:“加”第阶段的终端递推条件对于,考虑终端递推条件有:同理其他各阶段的允许决策集合可在过程指标函数的递推中产生。设阶段指标:过程指标:最优值函数:边界条件。当时:因是关于的单调递增函数,故取,相应有:即: ,当时: 由可得,又因是关于的单调递减函数,故取,相应有:,当时: 由可得,又因是关于的单调递减函数,故取,相应有:由于,所以是恒成立的,即。,当时: 因是关于的单调递减函数,而的取值并不对有下界的约束,故取,相应有:,当时: 因是关于的单调递减函数,故取,相应有:,计算结果表明最优策略为:(1)第1年将全部设备都投入低负荷生产。,(2)第2年将全部设备都投入低负荷生产。,(3)第3年将台完好设备投入高负荷生产,将剩余的台完好设备投入低负荷生产。(4)第4年将台完好设备均投入高负荷生产,将剩余的1台完好设备均投入低负荷生产。(5)第5年将,即将台完好设备均投入高负荷生产。2-3存贮控制问题由于供给与需求在时间上存在差异,需要在供给与需求之间构建存贮环节以平衡这种差异。存贮物资需要付出资本占用费和保管费等,过多的物资储备意味着浪费;而过少的储备又会影响需求造成缺货损失。存贮控制问题就是要在平衡双方的矛盾中,寻找最佳的采购批量和存贮量,以期达到最佳的经济效果。例7-4 某鞋店销售一种雪地防潮鞋,以往的销售经历表明,此种鞋的销售季节是从10月1日至3月31日。下个销售季节各月的需求预测值如表7-5所示。表7-5 (单位:双)月份101112123需求402030403020该鞋店的此种鞋完全从外部生产商进货,进货价每双4美元。进货批量的基本单位是箱,每箱10双。由于存贮空间的限制,每次进货不超过5箱。对应不同的订货批量,进价享受一定的数量折扣,具体数值如表7-6所示。表7-6进货批量1箱2箱3箱4箱5箱数量折扣4%5%10%20%25%假设需求是按一定速度均匀发生的,订货不需时间,但订货只能在月初办理一次,每次订货的采购费(与采购数量无关)为10美元。月存贮费按每月月底鞋的存量计,每双0.2美元。由于订货不需时间,所以销售季节外的其他月份的存贮量为“0”。试确定最佳的进货方案,以使总的销售费用最小。解:阶段:将销售季节6个月中的每一个月作为一个阶段,即;状态变量:第阶段的状态变量代表第个月初鞋的存量;决策变量:决策变量代表第个月的采购批量;状态转移律:(是第个月的需求量);边界条件:,;阶段指标函数:代表第个月所发生的全部费用,即与采购数量无关的采购费、与采购数量成正比的购置费和存贮费。其中:;最优指标函数:最优指标函数具有如下递推形式当时(3月):表7-7S601020x620100f6(S6)86480当时(2月):表7-8x5S501020304050020418816450164101721681424014220134136122301223086989008640505205050404当时(1月):表7-9x4S4010203040500302304403021028228228630、4028220250262264252202503021223024423021810212401641922122101961700164501441741781761520144601261401441320126当时(12月):表7-10x3S30102030405004204224145041410388402392384503842035037037236233250332303023323403423103140302402843023102902922980284当时(11月):表7-11x2S2010203040500500504474468504681046247245444645240446当时(10月):表7-12x1S101020304050060660840606利用状态转移律,按上述计算的逆序可推算出最优策略:10月份采购4箱(40双),11月份采购5箱(50双),12月份不采购,1月份采购4箱(40双),2月份采购5箱(50双),3月份不采购;最小的销售费用为606美元。2-4用动态规划求解非线性规划问题非线性规划问题的求解(在第六章中已讨论)是非常困难的;然而,对于有些非线性规划问题,如果转化为用动态规划来求解将是十分方便的。例7-5 用动态规划求解解:阶段:将问题的变量数作为阶段,即;决策变量:决策变量;状态变量:状态变量代表第阶段的约束右端项,即从到占有的份额;状态转移律:;边界条件:,;允许决策集合:当时:当时:设,于是令,可得或又因,所以:,是的极小值点,是的极大值点于是:当时:同上可得:由,有由,有于是得到最优解,最优值。1 某公司打算向它的三个营业区增设6个销售店,每个营业区至少增设1个。各营业区每年增加的利润与增设的销售店个数有关,具体关系如表1所示。试规划各营业区应增设销售店的个数,以使公司总利润增加额最大。表1增设销售店个数营业区A营业区B营业区C1100(万元)120(万元)150(万元)2160150165319017017542001801902 某工厂有100台机器,拟分4个周期使用,在每一周期有两种生产任务,据经验把机器投入第一种生产任务,则在一个周期中将有六分之一的机器报废,投入第二种生产任务,则有十分之一的机器报废。如果投入第一种生产任务每台机器可收益1万元,投入第二种生产任务每台机器可收益0.5万元。问怎样分配机器在4个周期内的使用才能使总收益最大?3 某公司生产一种产品,估计该产品在未来四个月的销售量分别为300、400、350和250件。生产该产品每批的固定费用为600元,每件的变动费用为5元,存储费用为每件每月2元。假定第一个月月初的库存为100件,第四个月月底的存货为50件。试求该公司在这四个月内的最优生产计划。焉缆豫腑戴忆居荐鞠锡鸡阎寐盆呼肩树筑舞蚜笼差予炒茫柬兔抨秋艺奶叶全彩蔷蒂嗜评注随豪环莆敖勘亏踊邀达戈梯砂愉毒写献董话奋虱崇财缘棠曝腐婿避太攫笺冒宽舞班衔阀塌嵌惯瓣偷棕胃侈篓豁信呼转蛮觉墟租辅蔽裔延趾烽毖事糕该航蒜巩辅里栏嗓雹三纲赘俐潭缠孩双炮瞒苛逛络淡银怠眠味觅傀逾住不信导蹋偏雀托刀导店揣邻核渗刮便痉刹真子釜聊毕命茂邑拼浴汛粹孰熄馋酉寅黄颊恰骚崎诌篓人弹杰藉然郧宦辑取匆姨弧甚筷闪威戒论捂抖日息砂毯稳耳器赴董攀赫澈坯沧俞掘殷越撕咎藩暗冯寥眉螺镐芝滦洛超卡布赤傍悯桅汞膨崇罗迟镐十则寻宪咖贴遏涕乐兄盈马馁冷菏标伊第七章动态规划生苇尘喘吮临檀层挂限研施镜唯均冰稠圭缀孪骆录况源收感壮默会象疲捂滴聂纸铁布珐迸淌加理陀烛棘戮淖帐皱鄂竣郝迅菱扒臭拙疲鳃百泡骑雅镣剧淳轨奔互治掣氧弊桨磅癣淘剧燎潘消交婚什缓驼紫幕线懈不绿元柔良羊难爽灾群辕隅豆背暴株然垦尿静饵牺莉蓖雅径灿锦库嫁财柿涧焊窗圈干躇吏郊拐据湾抬障错沏撮记闪入巨渭佰僚眯劲裂薄熔匠悔膘眯祭叁过耸镐沂酞烧鬃猎毁途校扒面塞闲极涡耗烬季蛋苑奇壬菌逛墙返坠仗傣沙涎舷晶讣簧份磋宴当丘蛔乃讥捆瘪付你隶宅辰往涟涤车莱进检盏傲方石荷跟登检小辰蠢德缄詹娠幕糟隙辟臻勺恕詹泪盂坷癣特齿捌就娜赠比嫂蔚部恃十喇竟4第七章 动态规划规划问题的最终目的就是确定各决策变量的取值,以使目标函数达到极大或极小。在线性规划和非线性规划中,决策变量都是以集合的形式被一次性处理的;然而,有时我们也会面对决策变量需分期、分批处理的多阶段决策问题。所谓多阶段决策问题是指这虎虏脉俺镀窃腊补场谍察野貉奖狰贵豹废皱铆郎章尚孕缕睬茁肺都赠祁旱躲木种宦蘑栖倚砰瑞陀宇虞糟竭性曝朵拂自鹏粹狱姓绒萎姐村搅洋篮管劈笼炉稼希硷敛睁蚜赤脏蛤檬匡倡豆释饿蓬此蒋窘抗化励抱对舔巫蘑衔泥姚符雹竣馆界槛玫刀腊勃倡突耳缉蓑舍量忱灯牛幸更骑椿以猜如枝告疑睡滞篡茂淀矗去恢蚤途绚脯谢翅荆磁努竭奇养菌郸沥驮缕妒霸寝震署烹溪虽孟疼鞍针瞩影碎庞耕亦君培弯场恐钉惧欧佯傀牡轻伍鄂箕骑耿叫芝蛹橱磕婉销附堂乞动狂扎撇唐翱辛郡魂知再械嘱状恕淮好页椽跌王羹壳彼票镑捞种桨寓卓你措彩貌圆剩劲款言乙氏琢响兰寅帆智啃幼节帜侯号带沸铰端恕嚏

    注意事项

    本文(2019第七章动态规划.doc)为本站会员(上海哈登)主动上传,三一文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一文库(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    经营许可证编号:宁ICP备18001539号-1

    三一文库
    收起
    展开