换一换

三一文库 > 资源分类 > PPT文档下载

预览

博弈论第四章完全且完美信息动态博弈.ppt

资源ID：62392 资源大小：963.50KB 全文页数：106页
资源格式： PPT 下载积分：5元

快捷下载

账号登录下载

微信登录下载

三方登录下载：

微信扫一扫登录

下载资源需要5元

邮箱/手机：
温馨提示：	快捷下载时，用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）。如填写123，账号就是123，密码也是123。
支付方式：
验证码：	换一换

加入VIP免费专享

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？

友情提示

1、下载资料失败解决办法

2、PDF文件下载后，可能会被浏览器默认打开，此种情况可以点击浏览器菜单，保存网页到桌面，就可以正常下载了。

3、本站不支持迅雷下载，请使用电脑自带的IE浏览器，或者360浏览器、谷歌浏览器下载即可。

4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩，下载后原文更清晰。

5、试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓。

博弈论第四章完全且完美信息动态博弈.ppt

1、第四章第四章完全且完美信息动态博弈完全且完美信息动态博弈本章讨论动态博弈，所有博弈方都对博弈过程和得益完全了解的完全且完美信息动态博弈。这类博弈也是现实中常见的基本博弈类型。由于动态博弈中博弈方的选择、行为有先后次序，因此在表示方法、利益关系、分析方法和均衡概念等方面，都与静态博弈有很大区别。本章对动态博弈分析的概念和方法，特别是子博弈完美均衡和逆推归纳法作系统介绍，并介绍各种经典的动态博弈模型。完全且完美完美信息动态博弈的主要特点（1）行动是顺序发生的，）行动是顺序发生的，（2）下一步行动选择之前，所有以前的行动都）下一步行动选择之前，所有以前的行动都可以被观察到，可以被观察到，（3）每个

2、可能的行动组合下局中人的收益是共）每个可能的行动组合下局中人的收益是共同知识同知识。第三章完全且完美信息动态博弈n一博弈扩展式表述n二子博弈完美纳什均衡n三、用逆向归纳法求-子博弈完美纳什均衡n四、完全且完美信息的动态博弈的案例一博弈扩展式表述（一）博弈的标准式（或战略式、正则式或策略式）女足球芭蕾男足球2，10，0芭蕾0，01，2博弈的标准式（战略式）博弈的标准式（战略式）40004000，4000400080008000，0 00 0，800080000 0，0 0不开发开发商A开发不开发开发-3000-3000，-3000-300010001000，0 00 0，100010000

3、 0，0 0不开发开发商B开发商A开发不开发开发开发商B需求小的情况需求小的情况需求大的情况需求大的情况（二）博弈扩展式表述（二）博弈扩展式表述u博弈的扩展式表述包括四个要素博弈的扩展式表述包括四个要素:参与人集合（Player）每个参与人的战略集合（Strategy）博弈的顺序（Order）由战略组合决定的每个参与人的支付（Payoff）扩展式表示的一个例子博弈树始于博弈树始于局中人局中人1 1 的一个决策结点，这时的一个决策结点，这时1要要从从L和和R中作出选择，如果局中人中作出选择，如果局中人1选择选择L，其后就到，其后就到达达局中人局中人2 2 的一个决策结点，这时，局中人的一个决

4、策结点，这时，局中人2要从要从L和和R中作出选择。类似地，如果局中人中作出选择。类似地，如果局中人1选择选择R，则将到达局中人则将到达局中人2的另一个决策结点。的另一个决策结点。这时局中人这时局中人2从从L和和R中选择行动。无论局中人中选择行动。无论局中人2选择了哪一个，都将到达终结点选择了哪一个，都将到达终结点(即博弈结束即博弈结束)且两且两局中人分别得到相应终点节下面的收益。局中人分别得到相应终点节下面的收益。A开发不开发NN大小1/21/2大小1/21/2BBBB开发不开发开发不开发开发不开发开发不开发(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)参

5、与人(A,B,N)战略支付参与人集合参与人行动顺序参与人的行动空间参与人的信息集参与人的支付函数外生事件的概率分布房地产开发博弈结,决策结结,终点结枝结,初始结信息集横向扩展式举例：横向扩展式举例：进入者进入不进入（0，300）在位者市场进入阻挠博弈树合作（40，50）斗争（-10，0）扩展型扩展型为了让“树”描绘博弈，其结点和枝需要满足三条性质：l1单单一一的的出出发发点点。重要的是知道博弈从何处开始，所以必须有一个，也只能有一个出发点。l2 无无循循环环。重要的是在博弈运行中，我们不要陷入僵局；树枝循原路折回并造成一个循循环环一定是不可接受的。l3 单单方方向向前前进进。重要的是，对于

6、博弈如何进行下去不能模棱两可，因此，必定不存在二个或多个枝导向同一个结。为保证这三条性质，在前结点上强加下述限为保证这三条性质，在前结点上强加下述限制：制：1结点不能是自身的前结点。2前结点的前结点也是前结点：如果结点是的前结点，依次结点是的前结点，那么也是的前结点。3前结点可以排序：如果和都是的前结点，必定是或者是的前结点，或者反过来。4必定存在一个共同的前结点：考虑任意两个结，和，它们之间没有一个是另一个的前结点。那么，必定存在一个结点，它是和双方的前结点。动态博弈的动态博弈的战略战略动态博弈的战略的表述动态博弈的战略的表述战略：参与人在给定信息集的情况下选择行动的规则，它规定参战略：参与

7、人在给定信息集的情况下选择行动的规则，它规定参与人在什么情况下选择什么行动，是参与人的与人在什么情况下选择什么行动，是参与人的“相机行动方案相机行动方案”。在静态博弈中，战略和行动是相同的。作为一种行动规则，战略必须是完备的。足球男足球芭蕾女女芭蕾足球芭蕾(2,1)(0，0)（1，2)(0,0)xxBattle of Sexes if Boy moves first足球男足球芭蕾女女芭蕾足球芭蕾(1,2)(-1，-1)（0，0)(2,1)xx男的策略：足球，芭蕾选择足球；还是选择芭蕾。女的策略：（足球，芭蕾），（芭蕾，足球）（芭蕾，芭蕾），（足球，足球）1、追随策略：他选择什么，我就选择什么2

8、对抗策略：他选择什么，我就偏不选什么3、芭蕾策略：不管他选什么，我都选芭蕾；4、足球策略：不管他选什么，我都选足球。策略即：如果他选择什么，我就怎样行动的相机行动方案。在扩展式博弈里，参与人是相机行事，即“等待”博弈到达一个自己的信息集（包含一个或多个决策结后，再采取行动方案。Battle of Sexes if Boy moves first可以写成标准式可以写成标准式(战略式战略式)-3,-3-3,-31,01,00,10,00,10,0足球,足球足球,芭蕾芭蕾,足球芭蕾,足球足球芭蕾wifewifehusbandhusband标准式标准式(战略式战略式)The strategy com

9、binations.(B,B,B),？在在8个图里找纳什均衡个图里找纳什均衡(1,2)(1,2)(-1,-1)(-1,-1)(0,0)(0,0)(2,1)(2,1)(1,2)(1,2)(-1,-1)(-1,-1)(0,0)(0,0)(2,1)(2,1)(1,2)(1,2)(-1,-1)(-1,-1)(0,0)(0,0)(2,1)(2,1)(1,2)(1,2)(-1,-1)(-1,-1)(0,0)(0,0)(2,1)(2,1)(1,2)(1,2)(-1,-1)(-1,-1)(0,0)(0,0)(2,1)(2,1)(1,2)(1,2)(-1,-1)(-1,-1)(0,0)(0,0)(2,1)(2,

10、1)(1,2)(1,2)(-1,-1)(-1,-1)(0,0)(0,0)(2,1)(2,1)(1,2)(1,2)(-1,-1)(-1,-1)(0,0)(0,0)(2,1)(2,1)Of 8 strategy combination,3 are Nash Three Nash equilibria of Battle of Sexes are:(B,B,B),(S,S,S),and (S,B,S);Their corresponding outcomes are all:(Ballet,Ballet),(Soccer,Soccer),and(Soccer,Soccer).BBBSSSBBBSSS

11、BBBSSS不同的纳什均衡可以对应相同的结果一个动态博弈可能有多个（甚至无穷多个）纳一个动态博弈可能有多个（甚至无穷多个）纳什均衡，究竟哪个更合理？什均衡，究竟哪个更合理？子博弈完美纳什均衡子博弈完美纳什均衡-不可置信威胁不可置信威胁l美国普林斯顿大学古尔教授在美国普林斯顿大学古尔教授在19971997年的年的经济学透视经济学透视里发表文章，提出一个例子说明威胁的可信性问题：里发表文章，提出一个例子说明威胁的可信性问题：l两两兄弟老是兄弟老是为为玩具玩具吵吵架，哥哥老是要架，哥哥老是要抢抢弟弟的玩具。弟弟的玩具。l不耐不耐烦烦的父的父亲亲宣布政策：好好去玩，不要宣布政策：好好去玩，不要吵吵我，

12、不管我，不管你你们谁们谁向我向我告告状状，我都把，我都把你你们们两个关两个关起起来来，关关起起来来比比没没有玩具更可怕。有玩具更可怕。l现现在，哥哥又把弟弟的玩具在，哥哥又把弟弟的玩具抢抢去玩了，弟弟去玩了，弟弟没没有有办办法，只好法，只好说说：快把玩具快把玩具还还我，不然我就要去告我，不然我就要去告诉诉爸爸。哥哥想，爸爸。哥哥想，你真你真要告要告诉诉爸爸爸，我是要倒霉的，可是爸，我是要倒霉的，可是你你不告不告状状不不过过没没有玩具玩，而告了有玩具玩，而告了状状却却要被要被关关禁禁闭闭，告，告状会状会使使你你的境遇的境遇变变得更坏，所以得更坏，所以你你不不会会告告状状，因，因此哥哥此哥哥对对弟

13、弟的警告置之不理弟弟的警告置之不理。l的确，如果弟弟是会算计自己利益的理性人，在这样的环境下，还是不告状的好。可见，弟弟是理性人，的确，如果弟弟是会算计自己利益的理性人，在这样的环境下，还是不告状的好。可见，弟弟是理性人，他的告状威胁是不可置信的。他的告状威胁是不可置信的。完全信息动态博弈完全信息动态博弈-子博弈完美纳什均衡子博弈完美纳什均衡泽尔腾（泽尔腾（1965）l考虑下列问题：考虑下列问题：一个博弈可能有多个（甚至无穷多个）纳什均衡，究竟哪个更合一个博弈可能有多个（甚至无穷多个）纳什均衡，究竟哪个更合理？理？纳什均衡纳什均衡假定每一个参与人在选择自己的最优战略时假定所有其假定每一个参与人

14、在选择自己的最优战略时假定所有其他参与人的战略是给定的他参与人的战略是给定的，但是如果参与人的行动有先有后，后，但是如果参与人的行动有先有后，后行动者的选择空间依赖于前行动者的选择，前行动者在选择时不行动者的选择空间依赖于前行动者的选择，前行动者在选择时不可能不考虑自己的行动对后行动者的影响。可能不考虑自己的行动对后行动者的影响。子博弈完美纳什均衡的一个重要改进是将子博弈完美纳什均衡的一个重要改进是将“合理纳什均衡合理纳什均衡”与与“不合理纳什均衡不合理纳什均衡”分开。分开。二、二、子博弈精炼纳什均衡（或子博弈完美纳什均衡）完美纳什均衡）l一个纳什均衡称为精炼纳什均衡，当只当参与人的战略在每个

15、子博弈中都构成纳什均衡，也就是说，组成完美纳什均衡的战略必须在每一个子博弈中都是最优的。l一个精炼纳什均衡首先必须是一个纳什均衡，但纳什均衡不一定是精炼纳什均衡。l承诺行动-当事人使自己的威胁战略变得可置信的行动。子博弈完美纳什均衡子博弈完美纳什均衡l泽尔腾引入子博弈完美纳什均衡的概念的目的是将那些不可置信威胁战略的纳什均衡从均衡中剔除，从而给出动态博弈的一个合理的预测结果，简单说，子博弈完美纳什均衡要求均衡战略的行为规则在每一个信息集上是最优的。l什么是子博弈，什么是子博弈完美纳什均衡？l有没有更好的方法找到子博弈完美纳什均衡？完全信息动态博弈完全信息动态博弈-子博弈完美纳什均衡子博弈完美纳

16、什均衡泽尔腾（泽尔腾（1965）l子博弈?Think of a branch of a tree as a(smaller)tree.If a branch of a tree representing a game does not divide any information set of the game,then it is a subgame of the game.l王P175什么是“支”？不开发A开发不开发BB开发不开发开发(1，0)（0，1)(0,0)(-3,-3)xx房地产开发博弈找出房地产开发博弈的子博弈找出房地产开发博弈的子博弈开发不开发(1，0)(-3,-3)x开发（0

17、1)(0,0)x子博弈I子博弈IIA开发不开发BB开发不开发开发(1，0)（0，1)(0,0)(-3,-3)xx子博弈动态博弈中的子博弈l虚线框出的部分正是博弈方2在博弈方1选择进时所面临的决策问题，它本身构成博弈方2的一个单人博弈，我们称它为原先来后到博弈的一个“子博弈”。Game and subgames（子博弈未标完）（子博弈未标完）子博弈定义子博弈定义由一个动态博弈第一阶段以外的某个阶段开始的后续博弈阶段构成，它必须有初始信息集，具备进行博弈所需要的各种信息，能够自成一个博弈的原博弈的一部分，称为原动态博弈的一个“子博弈”。l子博弈不好找！l学完后面的信息集请看P177信息集信息集为

18、了扩展式表述也可用来表述静态博弈，我们为了扩展式表述也可用来表述静态博弈，我们使用虚线圈。如：使用虚线圈。如：情爱博弈的扩展式表述情爱博弈的扩展式表述男足球芭蕾女女芭蕾足球芭蕾(1,2)(-1，-1)（0，0)(2,1)xx女足球芭蕾男男芭蕾足球芭蕾(1,2)(-1，-1)（0，0)(2,1)xxA开发不开发NN大小1/21/2大小1/21/2BBBB开发不开发开发不开发开发不开发开发不开发(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)B在决策时不确切地知道自然的选择;B的决策结由4个变为2个房地产开发博弈A开发不开发NN大小1/21/2大小1/21/2B

19、BBB开发不开发开发不开发开发不开发开发不开发(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)B知道自然的选择;但不知道A的选择(或A、B同时决策)房地产开发博弈Battle of Sexes againif Boy moves firstBoyGirlBalletBalletBalletSoccerSoccerSoccer(1,2)(-1,-1)(0,0)(2,1)Represent Battle of Sexes as a simultaneous-move game with a tree Information setsBoyGirlBalletBa

20、lletBalletSoccerSoccerSoccer(1,2)(-1,-1)(0,0)(2,1)博弈树的结构博弈树的结构l错误信息集示例见书166.l1、一个信息集罩住的首先必须是同一个局中人的决策节点。l2、一个信息集罩住的必须是同一个局中人在同一个时点的决策节点。l3、3、Same-set-same-strategies principle:At any decision node belonging to a specific information set,the player has same strategies/actions to choose.Thus,no games

21、like this:2.1 博弈的扩展式表述如果博弈树的所有信息集都是单结的，如果博弈树的所有信息集都是单结的，则称为则称为“完美信息博弈完美信息博弈”，没有任何两，没有任何两个决策结是用虚线连起来的个决策结是用虚线连起来的自然信息集总是假设为单结的自然信息集总是假设为单结的博弈树上是否出现连接不同决策结的虚博弈树上是否出现连接不同决策结的虚线取决于如何划决策结的顺序线取决于如何划决策结的顺序有了信息集的概念，扩展式表述也可用有了信息集的概念，扩展式表述也可用来表述静态博弈来表述静态博弈完全信息动态博弈完全信息动态博弈-子博弈完美纳什均衡子博弈完美纳什均衡泽尔腾（泽尔腾（1965）l子博弈：是

22、原博弈的一部分，它本身也可以作为一个独立的博弈进行分析：（1）子博弈必须从一个单结信息点开始：只有决策者在原博弈中确切地知道博弈进入一个特定的决策结时，该决策结才能作为一个子博弈的初始结。如果信息集包含两个以上的决策结，则这两个都不可以作为子博弈的初始结（见下页）。（2）子博弈的信息集和支付向量都直接继承自原博弈，即当x和x在原博弈中属于同一信息集时，他们在子博弈中才属于同一信息集。l习惯上，任何博弈的本身称为自身的一个子博弈。l书上的定义175：l1）S的博弈树是T的博弈树的一支（什么是支？见175）；l2）博弈S不能分割博弈T的信息集，具体说，质押博弈T的某个信息集的任何一个决策节点是博弈

23、S的一个决策节点，那么T的这个信息集的每一个决策节点都必须是博弈S的决策节点。l3）lP177l图表514A开发不开发XX大小1/21/2大小1/21/2BBBB开发不开发开发不开发开发不开发开发不开发(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)参与人X的信息集不能开始一个子博弈，否则的话，参与人B的信息将被切割。完全信息动态博弈完全信息动态博弈-子博弈完美纳什均衡子博弈完美纳什均衡泽尔腾（泽尔腾（1965）l子博弈完美纳什均衡：扩展式博弈的战略组合是一个子博弈完美纳什均衡，如果:（1）它是原博弈的纳什均衡；（2）它在每一个子博弈上给出纳什均衡。BBBS

24、SSBBBSSSBBBSSS(1,2)(1,2)(-1,-1)(-1,-1)(0,0)(0,0)(2,1)(2,1)(1,2)(1,2)(-1,-1)(-1,-1)(0,0)(0,0)(2,1)(2,1)(1,2)(1,2)(-1,-1)(-1,-1)(0,0)(0,0)(2,1)(2,1)Restricted to the circled subgames,the Nash are unstable.Thus there is only one subgame-perfect equilibrium.A开发不开发BB开发不开发开发(1，0)（0，1)(0,0)(-3,-3)xx房地产开发博弈

25、开发不开发(1，0)(-3,-3)x开发（0，1)(0,0)x子博弈I子博弈II(不开发，（开发，开发），（开发，（不开发，开发），（开发，（不开发，不开发）在c上构成均衡，在b上不构成；在b和c上都构成在c上构成均衡，在b上不构成完全信息动态博弈-子博弈完美纳什均衡泽尔腾（1965）不开发判断下列均衡结果哪个构成子博弈完美纳什均衡？不开发bc完全信息动态博弈完全信息动态博弈-子博弈完美纳什均衡子博弈完美纳什均衡泽尔腾（泽尔腾（1965）l如果一个博弈有几个子博弈，一个特定的纳什均衡决定了原博弈树上唯一的一条路径，这条路径称为“均衡路径”，博弈树上的其他路径称为“非均衡路径”。l纳什均衡只

26、要求均衡战略在均衡路径的决策结上是最优的；l而构成子博弈完美纳什均衡不仅要求在均衡路径上策略是最优的，而且在非均衡路径上的决策结上也是最优的。这是纳什均衡与子博弈完美纳什均衡的实质区别。BBBSSSBBBSSSBBBSSS(1,2)(1,2)(-1,-1)(-1,-1)(0,0)(0,0)(2,1)(2,1)(1,2)(1,2)(-1,-1)(-1,-1)(0,0)(0,0)(2,1)(2,1)(1,2)(1,2)(-1,-1)(-1,-1)(0,0)(0,0)(2,1)(2,1)Restricted to the circled subgames,the Nash are unstable.

27、Thus there is only one subgame-perfect equilibrium.完全信息动态博弈完全信息动态博弈-子博弈完美纳什均衡子博弈完美纳什均衡泽尔腾（泽尔腾（1965）l战略是参与人行动规则的完备描述，它要告诉参与人在每一种可预见的情况下（即每一个决策结）上选择什么行动，即使这种情况实际上没有发生（甚至参与人并不预期它会发生）。l因此，只有当一个战略规定的行动规则在所有可能的情况下都是最优的，它才是一个合理的可置信的战略，子博弈完美纳什均衡就是要剔除那些只在特定情况下是合理的而在其他情况下不合理的行动规则。完全信息动态博弈完全信息动态博弈-子博弈完美纳什均衡子博弈

28、完美纳什均衡泽尔腾（泽尔腾（1965）l练习练习:l参与人1（丈夫）和参与人2（妻子）必须独立决定出门时是否带伞。他们知道下雨和不下雨的可能性均为50%，支付函数为：如果只有一人带伞，下雨时带伞者的效用为-2.5，不带伞者的效用为-3不下雨时带伞的效用为-1,不带的效用为0;如两人都不带伞,下雨时每人的效用为-5,不下雨时每人的效用为1;给出下列四种情况下的扩展式及战略式表述:(1)两人出门前都不知道是否会下雨;并且两人同时决定是否带伞(即每一方在决策时都不知道对方的决策);(2)两人在出门前都不知道是否会下雨,但丈夫先决策，妻子观察到丈夫是否带伞后才决定自己是否带伞;(3)丈夫出门前知道是否

29、会下雨,但妻子不知道，但丈夫先决策，妻子后决策;(4),同(3),但妻子先决策，丈夫后决策.三、用逆向归纳法求三、用逆向归纳法求-子博弈完美纳子博弈完美纳什均衡什均衡微软公司的入门考试题微软公司的入门考试题l强盗分赃（向前展望，倒后推理）强盗分赃（向前展望，倒后推理）有有5 5个强盗抢得个强盗抢得100100枚金币，在如何分赃上争论不休，于枚金币，在如何分赃上争论不休，于是他们决定：是他们决定：（1 1）抽签决定个人的号码（）抽签决定个人的号码（1 1，2 2，3 3，4 4，5 5）（2 2）由）由1 1号提出分配方案，然后号提出分配方案，然后5 5人表决，如果方案超人表决，如果方案超过半数

30、同意就通过，否则他被扔进大海喂鲨鱼；过半数同意就通过，否则他被扔进大海喂鲨鱼；（3 3）1 1号死后，号死后，2 2号提方案，号提方案，4 4人表决，当且仅当超过半人表决，当且仅当超过半数同意时方案通过，否则数同意时方案通过，否则2 2号被扔进大海；号被扔进大海；（4 4）依次类推，知道找到一个每个人都接受的方案）依次类推，知道找到一个每个人都接受的方案（当然，如果只剩（当然，如果只剩5 5号，他独吞）号，他独吞）l结果会如何？结果会如何？强盗1234501001000098011970120强盗1234501001000098011970120970102三、用逆向归纳法求三、用逆向归纳法求

31、子博弈完美纳什均衡子博弈完美纳什均衡1UDL（3，1)(0,0)22，2R三、用逆向归纳法求三、用逆向归纳法求-子博弈完美纳什均衡子博弈完美纳什均衡1UDL（3，1)(0,0)22，2R 给定博弈达到最后一个决策结，该决策结上行动的参与人有一个最优选择，这个最优选择即该决策结开始的子博弈的纳什均衡倒数第二个决策结，找倒数第二个的最优选择，这个最优选择与我们在第一步找到的最优选择构成一个纳什均衡。如此重复直到初始结。每一步都得到对应于子博弈的一个纳什均衡，并且根据定义，该纳什均衡一定是该子博弈的子博弈纳什均衡，这个过程的最后一步得到整个博弈的纳什均衡完全信息动态博弈完全信息动态博弈-子博弈完

32、美纳什均衡子博弈完美纳什均衡泽尔腾（泽尔腾（1965）1UDL（1，1)22，0RU（3，0)(0,2)1D 子博弈完美纳什均衡子博弈完美纳什均衡（U U，U U），），L L）.U U和和L L分别是参与人分别是参与人1 1和和参与人参与人2 2在非均衡路径上的在非均衡路径上的选择。选择。逆向归纳法求解子博弈逆向归纳法求解子博弈完美纳什均衡的过程，完美纳什均衡的过程，实质实质上是重复剔除劣战略的过程上是重复剔除劣战略的过程：从最后一个决策结依次剔除从最后一个决策结依次剔除每个子博弈的劣战略，最后每个子博弈的劣战略，最后生存下来的战略构成完美纳生存下来的战略构成完美纳什均衡。什均衡。122左右

33、ABCD（3,1）（5,6）（4,2）（2,7）h1h12h22122左右BD（5,6）（2,7）h1h12h2212左B（5,6）h1h12完全信息动态博弈完全信息动态博弈-子博弈完美纳什均衡子博弈完美纳什均衡泽尔腾（泽尔腾（1965）l用逆向归纳法求解的子博弈完美纳什均衡也要求“所有的参与人是理性的”是共同知识。l如果博弈由多个阶段组成，则从逆向归纳法得到的均衡可能并不非常令人信服。1D(1,1)A2D(1/2,1/2)AiD(1/i,1/i)AnD(1/n,1/n)A 逆向归纳法要求“所有参与人是理性的”是所有参与人的共同知识。因此，在有多个参与人有多个参与人或每个参与人有多每个参与人有

34、多次行动机会次行动机会的情况下，逆向归纳法的结果可能并非如此。多个参与人的情况多个参与人的情况（2,2)如果如果n很小，逆向很小，逆向归纳法的结果归纳法的结果逆向归纳法与子搏弈完美纳什均衡的存在问题逆向归纳法与子搏弈完美纳什均衡的存在问逆向归纳法与子搏弈完美纳什均衡的存在问题题l如果n很大，结果又如何呢？1D(1,1)A2D(1/2,1/2)AiD(1/i,1/i)AnD(1/n,1/n)A多个参与人的情况多个参与人的情况（2,2)如果如果n很大很大对于参与人1，获得2单位支付前提是所有n-1个参与人都选A，否则就要考虑是否应该选择D以保证1的支付。如果给定一个参与人选择A的概率是p0;(2

35、)企业企业2观测到然后选择产量观测到然后选择产量q2 0(3)企业企业1的收益由下面的利的收益由下面的利润函数给出：润函数给出：P(Q)l对上面的通过求极值可得：对上面的通过求极值可得：l已知q1a-c,在前面我们分析同时行动的古诺博弈中，得出的R2(q1)和上式完全一致，两者的不同之处在于这里的R2(q1)是企业2对企业1已观测到的产量的真实反真实反应应，而在古诺的分析中，R2(q1)是企业2对假定的企业1的产量的最优反应最优反应，且企业1的产量选择是和企业2同时作出的。l由于企业由于企业1也能够像企业也能够像企业2一样解出企业一样解出企业2的最优反应，的最优反应，企业企业1就可以预测到他如

36、选择就可以预测到他如选择q1，企业，企业2将根据将根据R2(q1)选选择产量。那么在博弈的第一阶段，企业择产量。那么在博弈的第一阶段，企业1的问题就可表的问题就可表示为：示为：解得：解得：l这就是斯塔克尔贝里双头垄断博弈的逆向归纳解。这就是斯塔克尔贝里双头垄断博弈的逆向归纳解。l对斯塔科尔贝里双头垄断博弈的逆向归纳解的对斯塔科尔贝里双头垄断博弈的逆向归纳解的评价评价：l回顾在古诺博弈的纳什均衡中，每一企业的产量为回顾在古诺博弈的纳什均衡中，每一企业的产量为(a一一c)/3,也就是说，斯塔克尔贝里博弈中逆向归纳解的总产也就是说，斯塔克尔贝里博弈中逆向归纳解的总产量量3(a-c)/4，比古诺博弈中

37、纳什均衡的总产量，比古诺博弈中纳什均衡的总产量2(a-c)/3要高，从而斯塔克尔贝里博弈相应的市场出要高，从而斯塔克尔贝里博弈相应的市场出清价格就比较低。清价格就比较低。l不过在斯塔克尔贝里博弈中，企业不过在斯塔克尔贝里博弈中，企业1完全可以选择古诺完全可以选择古诺均衡产量均衡产量(a一一c)/3，这时企业，这时企业2的最优反应同样是古诺的最优反应同样是古诺均衡的产量，也就是说在斯塔克尔贝里博弈中，企业均衡的产量，也就是说在斯塔克尔贝里博弈中，企业1完全可以使利润水平达到古诺均衡的水平，而却选择了完全可以使利润水平达到古诺均衡的水平，而却选择了其他产量，其他产量，l那么企业那么企业1在斯塔克尔

38、贝里博弈中的利润一定高于其在在斯塔克尔贝里博弈中的利润一定高于其在古诺博弈中的利润。但斯塔克尔贝里博弈中的市场出清古诺博弈中的利润。但斯塔克尔贝里博弈中的市场出清价格降低了，从而总利润水平也会下降，那么和古诺博价格降低了，从而总利润水平也会下降，那么和古诺博弈的结果相比，在斯塔克尔贝里博弈中，企业弈的结果相比，在斯塔克尔贝里博弈中，企业1利润的利润的增加必定意味着企业增加必定意味着企业2福利的恶化。福利的恶化。l和古诺博弈相比，斯塔克尔贝里博弈中企业和古诺博弈相比，斯塔克尔贝里博弈中企业2利润水平利润水平的降低，揭示了单人决策问题和多人决策间题的一个重的降低，揭示了单人决策问题和多人决策间题的

39、一个重要不同之处。在单人决策理论中，占有更多的信息决不要不同之处。在单人决策理论中，占有更多的信息决不会对决策制定者带来不利，然而在博弈论中，会对决策制定者带来不利，然而在博弈论中，了解更多了解更多的信息的信息(或更为精确地说，是让其他参加者知道一个人或更为精确地说，是让其他参加者知道一个人掌握更多的信息掌握更多的信息)却可以让一个参与者受损。却可以让一个参与者受损。斯塔科尔贝里博弈中信息进一步的探讨斯塔科尔贝里博弈中信息进一步的探讨l在斯塔克尔贝里博弈中，存在问题的信息是企业的产在斯塔克尔贝里博弈中，存在问题的信息是企业的产量量:企业企业2知道知道q1,并且并且(重要的是重要的是)企业企业1

40、知道企业知道企业2知知道道q1。为看清楚这一信息的影响，我们把上面序贯行。为看清楚这一信息的影响，我们把上面序贯行动的博弈稍作修改，假设企业动的博弈稍作修改，假设企业1先选择先选择q1，之后企业，之后企业2选择选择q2，但事前并没有观测到，但事前并没有观测到q1,如果企业如果企业2确信企确信企业业1选择了它的斯塔克尔贝里产量选择了它的斯塔克尔贝里产量(a-c)/2，则企业，则企业2的最优反应仍是的最优反应仍是R2(q1)=(a-c)/4。l但是，如果企业但是，如果企业1预测到企业预测到企业2将持有这一推断并选择将持有这一推断并选择这一产量，企业这一产量，企业1就会倾向于它对就会倾向于它对l(a

41、c)/4的最优反应的最优反应-即即3(a-c)/8而不愿去选择而不愿去选择斯塔克尔贝里产量斯塔克尔贝里产量(a-c)/2，那么企业，那么企业2就不会相信就不会相信企业企业1选择了斯塔克尔贝里产量。从而这一修改过选择了斯塔克尔贝里产量。从而这一修改过的序贯行动博弈的惟一纳什均衡，对两个企业都是的序贯行动博弈的惟一纳什均衡，对两个企业都是选择产量选择产量(a-c)/3.-这正是古诺博弈中的纳什均衡，这正是古诺博弈中的纳什均衡，其中企业是同时行动的。其中企业是同时行动的。2 2、里昂惕夫的工会模型、里昂惕夫的工会模型l在里昂惕夫在里昂惕夫(1946)模型中，讨论了一个企业和一个垄模型中，讨论了一个

42、企业和一个垄断的工会组织断的工会组织(即作为企业劳动力惟一供给者的工会即作为企业劳动力惟一供给者的工会组织组织)的相互关系的相互关系:工会对工资水平说一不二，但企业工会对工资水平说一不二，但企业却可以自主决定就业人数却可以自主决定就业人数(在更符合现实情况的模型在更符合现实情况的模型中，企业和工会间就工资水平讨价还价，但企业仍自中，企业和工会间就工资水平讨价还价，但企业仍自主决定就业，得到的定性结果与本模型相似主决定就业，得到的定性结果与本模型相似)。工会。工会的效用函数为的效用函数为U(W,L)，其中，其中W为工会向企业开出的为工会向企业开出的工资水平，工资水平，L为就业人数。为就业人数。l

43、假定假定U(W,L)是是W和和L的增函数。企业的利润函数为的增函数。企业的利润函数为，其中，其中R(L)为企业雇佣为企业雇佣L名工人可以取得的收入名工人可以取得的收入(在最在最优的生产和产品市场决策下优的生产和产品市场决策下)，假定，假定R(L)是增函数，并是增函数，并且为凹函数。且为凹函数。l假定博弈的时序为假定博弈的时序为:(1)工会给出需要的工资水平工会给出需要的工资水平W;(2)企业观测到企业观测到(并接受并接受)W，随后选择雇佣人数，随后选择雇佣人数L;(3)收益分收益分别为别为U(W,L)和和。即使没有假定。即使没有假定U(W,L)和和R(L)的具体的表达式，从而无法明确解出该

44、博弈的逆向归的具体的表达式，从而无法明确解出该博弈的逆向归纳解，但我们仍可以就解的主要特征进行讨论。纳解，但我们仍可以就解的主要特征进行讨论。l首先，对工会在第一阶段任意一个工资水平首先，对工会在第一阶段任意一个工资水平w，我们能，我们能够分析在第二阶段企业最优反应够分析在第二阶段企业最优反应L*(W)的特征。给定的特征。给定w，企业选择，企业选择L*(W)满足下式满足下式:l一阶条件为：一阶条件为：l为了满足上述一阶条件，假设为了满足上述一阶条件，假设R(0)=;R()=0.l下面的图把下面的图把L*(w)表示为表示为w的函数的函数(但坐标轴经过旋转但坐标轴经过旋转以便于和以后的数据相比较以

45、便于和以后的数据相比较)，并表示出它和企业每，并表示出它和企业每条等利润线交于其最高点。若令条等利润线交于其最高点。若令L保持不变，保持不变，lL保持不变，保持不变，w降低时企业的利润就会提高，于是较低降低时企业的利润就会提高，于是较低的等利润曲线代表了较高的利润水平。的等利润曲线代表了较高的利润水平。l这张图描述了工会的无差异曲线，若令这张图描述了工会的无差异曲线，若令L不变，当不变，当w提高时工会的福利就会增加。于是较高的无差异曲线提高时工会的福利就会增加。于是较高的无差异曲线代表了工会较高的效用水平。代表了工会较高的效用水平。l下面我们分析工会在第一阶段的问题，由于工会和企业下面我们分析

46、工会在第一阶段的问题，由于工会和企业同样可以解出企业在第二阶段的问题，工会就可预测到同样可以解出企业在第二阶段的问题，工会就可预测到如果它要求的工资水平为如果它要求的工资水平为w1，企业最优反应的就业人数，企业最优反应的就业人数将会是将会是L*(w1)。那么，工会在第一阶段的问题可以表示。那么，工会在第一阶段的问题可以表示为为:l表现在图中的无差异曲线上就是，工会希望选择一个工表现在图中的无差异曲线上就是，工会希望选择一个工资水平资水平w，由此得到的结果，由此得到的结果(w，L*(w)处于可能达到的处于可能达到的最高的无差异线上。这一最优化间题的解为最高的无差异线上。这一最优化间题的解为w*，

47、这样一，这样一个工资要求将使得工会通过个工资要求将使得工会通过(w*，L*(w*)的无差异曲线的无差异曲线与与L*(w)相切于该点，如图所示。从而相切于该点，如图所示。从而(w*，L*(w*)就就是这一工资与就业博弈的逆向归纳解。是这一工资与就业博弈的逆向归纳解。l更进一步我们还可以看出，更进一步我们还可以看出，(w*,L*(w*)是低效率的，是低效率的，在上图中，如果在上图中，如果w和和L处于图中阴影部分以内，企业和处于图中阴影部分以内，企业和工会的效用水平都会提高。这种低效率对实践中企业工会的效用水平都会提高。这种低效率对实践中企业对雇佣工人数量保持的绝对控制权提出了质疑。对雇佣工人数量保

48、持的绝对控制权提出了质疑。(允许允许工人和企业就工资相互讨价还价，但企业仍对雇佣工工人和企业就工资相互讨价还价，但企业仍对雇佣工人数量绝对控制，也会得到相似的低效率解人数量绝对控制，也会得到相似的低效率解)。l埃斯皮诺萨和里埃斯皮诺萨和里(Espi nosa&Rhee,1989)基于如下事基于如下事实为这一质疑提供了一个解释实为这一质疑提供了一个解释:企业和工会之间经常会企业和工会之间经常会进行定期或不定期的重复谈判进行定期或不定期的重复谈判(在美国经常是每三年一在美国经常是每三年一次次)，在这样的重复博弈中，可能会存在一个均衡，使，在这样的重复博弈中，可能会存在一个均衡，使得工会的选择得工会

49、的选择w和企业的选择和企业的选择L都在图所示的阴影部分都在图所示的阴影部分以内，即使在每一次性谈判中，这样的以内，即使在每一次性谈判中，这样的w和和L都不是逆都不是逆向归纳解。向归纳解。3 3、序贯谈判（讨价还价博弈）、序贯谈判（讨价还价博弈）l分析一个三阶谈判模型分析一个三阶谈判模型接受接受不接受，甲不接受，甲乙必须接受乙必须接受讨价还价博弈讨价还价博弈甲甲出出S1乙乙接受接受不接受，出不接受，出S2 甲甲(S1,1-S1)S2,(1-S2)2S,2(1-S)l参与人参与人1和和2就一美元的分配进行谈判。他们轮流提出方案就一美元的分配进行谈判。他们轮流提出方案:首首先参与人先参与人

50、1提出一个分配建议，参与人提出一个分配建议，参与人2可以接受或拒绝可以接受或拒绝;如果如果参与人参与人2拒绝，就由参与人拒绝，就由参与人2提出分配建议，参与人提出分配建议，参与人1选择接受选择接受或拒绝或拒绝;如此一直进行下去。一个条件一旦被拒绝，它就不再如此一直进行下去。一个条件一旦被拒绝，它就不再有任何约束力，并和博弈下面的进行不再相关。每一个条件都有任何约束力，并和博弈下面的进行不再相关。每一个条件都代表一个阶段，参与人都没有足够的耐心代表一个阶段，参与人都没有足够的耐心:他们对后面阶段得他们对后面阶段得到的收益进行贴现，每一阶段的贴现因子为到的收益进行贴现，每一阶段的贴现因子为l l（

注意事项: 本文（博弈论第四章完全且完美信息动态博弈.ppt）为本站会员（peixunshi0）主动上传，三一文库仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对上载内容本身不做任何修改或编辑。若此文所含内容侵犯了您的版权或隐私，请立即通知三一文库（点击联系客服），我们立即给予删除！