第二次课动态规划.ppt
《第二次课动态规划.ppt》由会员分享,可在线阅读,更多相关《第二次课动态规划.ppt(84页珍藏版)》请在三一文库上搜索。
1、第二章 动态规划及其应用,本周POJ上做题:动态规划,1037 A decorative fence、 1050 To the Max、 1088 滑雪、 1125 Stockbroker Grapevine、 1141 Brackets Sequence、 1159 Palindrome、 1160 Post Office、 1163 The Triangle、 1458 Common Subsequence、 1579 Function Run Fun、 1887 Testing the CATCHER、 1953 World Cup Noise、 2386 Lake Counting,动
2、态规划是1951年由美国数学家贝尔曼(Richard Bellman)提出,它是解决一类多阶段决策问题的优化方法,也是考察问题的一种途径。 动态规划方法是现代企业管理中的一种重要决策方法。如果一个问题可将其过程划分为若干个相互联系的阶段问题,且它的每一阶段都需进行决策,则这类问题均可用动态规划方法进行求解。 根据多阶段决策过程的时序和决策过程的演变,动态规划方法有以下四种类型:离散确定型、离散随机型、连续确定型和连续随机型。,几类算法的经典名言,动态规划:不做重复的事; 贪心法:只选最好的; 分支定界法:没戏的就杀掉; 回溯法:碰壁就回头。,作人生规划要善于利用动态规划; 找女朋友要善于利用好
3、贪心算法; 人生重大决策要活学活用回溯法;,算法总体思想,动态规划算法与分治法类似,其基本思想也是将待求解问题分解成若干个子问题,为什么动态规划比递归算法有效?,但是经分解得到的子问题往往不是互相独立的。不同子问题的数目常常只有多项式量级。在用分治法求解时,有些子问题被重复计算了许多次,因此利用递归算法得到的算法往往是指数复杂度的算法。 如果能够保存已解决的子问题的答案,而在需要时再找出已求得的答案,就可以避免大量重复计算,从而得到多项式时间算法。,POJ 2753 Fibonacci数列例子:,确定Fibonacci sequence fn项的值: 考虑Fibonacci sequence的
4、递归定义: 我们将得到如下的递归算法:,在POJ上递交之后,返回的结果是:Time Limited。而不是可爱的AC,子问题的重叠性,将上述递归算法展开: 可以看出 f(n-1) 被调用 1次, f(n-2)被调用 2次, 等等. 这将导致大量的调用 最终解为:,树形递归,计算过程中存在冗余计算,为了除去冗余计算,可以从已知条件开始计算,并记录计算过程中的中间结果。,动态规划,例:POJ 2753 Fibonacci数列 int fn+1; f1=f2=1; int I; for(i=3;i=n;i+) fi = fi-1+fi-2; cout fn endl; 用空间换时间,动态规划算法的基
5、本要素,一、最优子结构,一个最优化策略具有这样的性质,不论过去状态和决策如何,对前面的决策所形成的状态而言,余下的诸决策必须构成最优策略。简而言之,一个最优化策略的子策略总是最优的。一个问题满足最优化原理又称其为最优子结构性质。,同一个问题可以有多种方式刻划它的最优子结构,有些表示方法的求解速度更快(空间占用小,问题的维度低),例如:最短路径问题。a b c,在分析问题的最优子结构性质时,所用的方法具有普遍性:首先假设由问题的最优解导出的子问题的解不是最优的,然后再设法说明在这个假设下可构造出比原问题最优解更好的解,从而导致矛盾。,动态规划算法的基本要素,二、重叠子问题,递归算法求解问题时,每
6、次产生的子问题并不总是新问题,有些子问题被反复计算多次。这种性质称为子问题的重叠性质。,动态规划算法,对每一个子问题只解一次,而后将其解保存在一个表格中,当再次需要解此子问题时,只是简单地用常数时间查看一下结果。,通常不同的子问题个数随问题的大小呈多项式增长。因此用动态规划算法只需要多项式时间,从而获得较高的解题效率。,一、例子(最短路问题),假如上图是一个线路网络,两点之间连线上的数字表示两点间的距离(或费用),我们的问题是要将货物从A地运往E地,中间通过B、C、D三个区域,在区域内有多条路径可走,现求一条由A到E的线路,使总距离最短(或总费用最小)。,将该问题划分为4个阶段的决策问题 第一
7、阶段为从A到Bj(j=1,2,3),有三种决策方案可供选择; 第二阶段为从Bj到Cj(j=1,2,3),也有三种方案可供选择; 第三阶段为从Cj到Dj(j=1,2),有两种方案可供选择;第四阶段为从Dj到E,只有一种方案选择。,如果用完全枚举法,则可供选择的路线有3321=18(条),将其一一比较才可找出最短路线: AB1C2D3E 其长度为12。,显然,这种方法是不经济的,特别是当阶段数很多,各阶段可供的选择也很多时,这种解法甚至在计算机上完成也是不现实的。 由于我们考虑的是从全局上解决求A到E的最短路问题,而不是就某一阶段解决最短路线,因此可考虑从最后一阶段开始计算,由后向前逐步推至A点:
8、,第四阶段,由D1到E只有一条路线,其长度f4(D1)=3, 同理f4(D2)=4。 第三阶段,由Cj到Di分别均有两种选择,即,,决策点为D1,决策点为D1,,决策点为D2,第二阶段,由Bj到Cj分别均有三种选择,即:,决策点为C2,决策点为C1或C2,决策点为C2,第一阶段,由A到B,有三种选择,即:,决策点为B3,f1(A)=15说明从A到E的最短距离为12,最短路线的确定可按计算顺序反推而得。即 AB3C2D2E 上述最短路线问题的计算过程,也可借助于图形直观的表示出来:,图中各点上方框的数,表示该点到E的最短距离。图中红箭线表示从A到E的最短路线。,从引例的求解过程可以得到以下启示:
9、,对一个问题是否用上述方法求解,其关键在于能否将问题转化为相互联系的决策过程相同的多个阶段决策问题。,所谓多阶段决策问题是:把一个问题看作是一个前后关联具有链状结构的多阶段过程,也称为序贯决策过程。如下图所示:,在处理各阶段决策的选取上,不仅只依赖于当前面临的状态,而且还要注意对以后的发展。即是从全局考虑解决局部(阶段)的问题。 各阶段选取的决策,一般与“时序”有关,决策依赖于当前的状态,又随即引起状态的转移,整个决策序列就是在变化的状态中产生出来,故有“动态”含义。因此,把这种方法称为动态规划方法。 决策过程是与阶段发展过程逆向而行。,拦截导弹 (poj1887 ),某国为了防御敌国的导弹袭
10、击,发展出一种导弹拦截系统。但是这种导弹拦截系统有一个缺陷:虽然它的第一发炮弹能够到达任意的高度,但是以后每一发炮弹都不能高于前一发的高度。某天,雷达捕捉到敌国的导弹来袭。由于该系统还在试用阶段,所以只有一套系统,因此有可能不能拦截所有的导弹。,输入 输入数据为导弹依次飞来的高度,所有高度值均为不大于30000的正整数。 输出 输出只有一行是这套系统最多能拦截的导弹数。,输入样例 389 207 155 300 299 170 158 65 输入样例 6,题目分析,因为只有一套导弹拦截系统,并且这套系统除了第一发炮弹能到达任意高度外,以后的每一发炮弹都不能高于前一发炮弹的高度;所以,被拦截的导
11、弹应该按飞来的高度组成一个非递增序列。 题目要求我们计算这套系统最多能拦截的导弹数,并依次输出被拦截导弹的高度,实际上就是要求我们在导弹依次飞来的高度序列中寻找一个最长非递增子序列。,设X=x1,x2,xn为依次飞来的导弹序列,Y=y1,y2,yk为问题的最优解(即X的最长非递增子序列),s为问题的状态(表示导弹拦截系统当前发送炮弹能够到达的最大高度,初值为s=第一发炮弹能够到达任意的高度)。,如果y1=x1,即飞来的第一枚导弹被成功拦截。那么,根据题意“每一发炮弹都不能高于前一发的高度”,问题的状态将由s=变成sx1(x1为第一枚导弹的高度);,在当前状态下,序列Y1=y2,yk也应该是序列
12、X1=x2,xn的最长非递增子序列(大家用反证法很容易证明)。 也就是说,在当前状态sx1下,问题的最优解Y所包含的子问题(序列X1)的解(序列Y1)也是最优的。这就是拦截导弹问题的最优子结构性质。,设D(i)为第i枚导弹被拦截之后,这套系统最多还能拦截的导弹数(包含被拦截的第i枚)。 我们可以设想,当系统拦截了第k枚导弹xk,而xk又是序列X=x1,x2,xn中的最小值,即第k枚导弹为所有飞来的导弹中高度最低的,则有D(k)=1;当系统拦截了最后一枚导弹xn,那么,系统最多也只能拦截这一枚导弹了,即D(n)=1;其它情况下,也应该有D(i)1。,根据以上分析,可归纳出问题的动态规划递归方程为
13、:,假设系统最多能拦截的导弹数为dmax(即问题的最优值),则 dmax (i为被系统拦截的第一枚导弹的顺序号),所以,要计算问题的最优值dmax,需要分别计算出D(1)、D(2)、D(n)的值,然后将它们进行比较,找出其中的最大值。,根据上面分析出来的递归方程,我们完全可以设计一个递归函数,采用自顶向下的方法计算D(i)的值。然后,对i从1到n分别调用这个递归函数,就可以计算出D(1)、D(2)、D(n)。,但这样将会有大量的子问题被重复计算。比如在调用递归函数计算D(1)的时候,可能需要先计算D(5)的值;之后在分别调用递归函数计算D(2)、D(3)、D(4)的时候,都有可能需要先计算D(
14、5)的值。如此一来,在整个问题的求解过程中,D(5)可能会被重复计算很多次,从而造成了冗余,降低了程序的效率。,其实,通过以上分析,我们已经知道:D(n)=1。如果将n作为阶段对问题进行划分,根据问题的动态规划递归方程,我们可以采用自底向上的方法依次计算出D(n-1)、D(n-2)、D(1)的值。这样,每个D(i)的值只计算一次,并在计算的同时把计算结果保存下来,从而避免了有些子问题被重复计算的情况发生,提高了程序的效率。,int main() int h2000,d2000,count,c,max,i,j;/h表示高度值,d表示最优值,c是能拦截得最多导弹数 count=0; while(s
15、canf(“%d“,h+count+)!=EOF); /输入高度 dcount-1=1; c=1; for(i=count-2;icount;j+) if((hi=hj) ,思考题,上述问题修改成:要求拦截所有导弹,则需要多少套上述系统?,实例POJ2122:Flight Planning,Your job is to write a program that plans airplane flights. Each flight consists of a series of one or more legs. Your program must choose the best altitu
16、de for each leg to minimize the amount of fuel consumption during the trip.,The airplane has a fixed airspeed, given by the constant VCRUISE, and a most-efficient cruising altitude, AOPT. When flying at altitude AOPT, fuel consumption in gallons per hour is given by GPHOPT. When flying at an altitud
17、e that is different from AOPT, fuel consumption increases by GPHEXTRA for each 1000 feet above or below AOPT.,The flight starts and finishes at an altitude of 0. Each 1000 foot climb burns an extra amount of fuel given by CLIMBCOST (there is no reduction in fuel consumption when you descend). Make t
18、he approximation that all climbing and descending is done in zero time at the beginning of each flight leg.,Thus each leg is flown at a constant airspeed and altitude. For this problem, the airplane characteristics are given by the following constants:,VCRUISE 400 knots (a knot is one nautical mile(
19、1.852km) per hour) AOPT 30,000 feet GPHOPT 2000 gallons per hour GPHEXTRA 10 gallons per hour for each 1000 feet CLIMBCOST 50 gallons per 1000 feet of climb,Before each flight, you are given the length of each leg and the tailwind expected for each leg. A positive tailwind increases the airplanes sp
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第二次 动态 规划
链接地址:https://www.31doc.com/p-2980992.html