《博弈论课件2.ppt》由会员分享,可在线阅读,更多相关《博弈论课件2.ppt(75页珍藏版)》请在三一文库上搜索。
1、第二章 完全信息静态博弈,本章介绍完全信息静态博弈。完全信息静态博弈即各博弈方同时决策,且所有博弈方对各方得益都了解的博弈。囚徒的困境、齐威王田忌赛马、猜硬币、石头剪子布、古诺产量决策都属于这种博弈。完全信息静态博弈属于非合作博弈最基本的类型。本章介绍完全信息静态博弈的一般分析方法、纳什均衡概念、各种经典模型及其应用等。,本章分六节,2.1基本分析思路和方法 2.2纳什 均衡 2.3无限策略博弈分析和反应函数 2.4混合策略和混合策略纳什均衡 2.5纳什均衡的存在性 2.6纳什均衡的选择和分析方法扩展,2.1 基本分析思路和方法,2.1.1 上策均衡 2.1.2 严格下策反复消去法 2.1.3
2、 划线法 2.1.4 箭头法,2.1.1 上策均衡,上策:不管其它博弈方选择什么策略,一博弈方的某个策略给他带来的得益始终高于其它的策略,至少不低于其他策略的策略 囚徒的困境中的“坦白”;双寡头削价中“低价”。 上策均衡:一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策,必然是该博弈比较稳定的结果 上策均衡不是普遍存在的,2.1.2 严格下策反复消去法,严格下策:不管其它博弈方的策略如何变化,给一个博弈方带来的收益总是比另一种策略给他带来的收益小的策略 严格下策反复消去:,2.1.3 划线法,2.1.4 箭头法,2.2 纳什均衡,2.2.1 纳什均衡的定义 2.2.2 纳什均衡的一致
3、预测性质 2.2.3 纳什均衡与严格下策反复消去法,2.2.1 纳什均衡的定义,策略空间: 博弈方 的第 个策略: 博弈方 的得益: 博弈: 纳什均衡:在博弈 中,如果由各个博弈方的各一个策略组成的某个策略组合 中,任一博弈方 的策略,都是对其余博弈方策略的组合 的最佳对策,也即 对任意 都成立,则称 为 的一个纳什均衡,策略型博弈的实例和解(性别战),例. 性别战(battle of the sexes),一男一女恋爱,有些业余活动要安排,或者去看足球比赛,或者去看芭蕾舞演出。男的偏好足球,女的则更喜欢芭蕾舞,但他们都宁愿在一起,不愿分开。下表给出收益矩阵:,策略型博弈的实例和解(性别战),
4、例. 性别战(battle of the sexes),这个博奕中有两个纳什均衡:(足球,足球)和(芭蕾,芭蕾)。就是说,一方去足球场,另一方也会去足球场;类似地,一方去看芭蕾,另一方也会去看芭蕾。在实际生活中,也许是这一次看足球,下一次看芭蕾,如此循环,形成一种默契。这在实际生活中是指,两种互补的活动应该配合,尽管配合的方式可能有很多种。,比如,两家工厂生产的产品可能是互补的,一家为另一家提供零配件,这里有一个标准的选择问题,由于种种原因,很可能在产品标准的选择上,生产成品的厂家与生产零配件的厂家之间有冲突。这就需要相互妥协,但妥协的结果有两种可能,或者是生产零配件的厂家适应生产成品的厂家,
5、或者是生产成品的厂家适应于生产零配件的厂家。,策略型博弈的实例和解(性别战),例. 性别战(battle of the sexes),博弈论和对策行为,策略型博弈的实例和解(性别战),例. 性别战(battle of the sexes),性别战的例子中有两个纳什均衡,那么,究竟那一个纳什均衡会实际发生?我们不知道。这里还有一个先动优势(first-mover advantage),比如说,若男的先买票,两人就会出现在足球场,若女的买票,两人就会出现在芭蕾舞剧院。,博弈论和对策行为,性别战在经济学上的应用,下表是两个竞争企业是否推出新产品的利益矩阵。,这个博奕中有两个纳什均衡:一家推出新产品,
6、一家无新产品。推出新产品的企业赢利为10,无新产品的企业赢利为-5。究竟是企业1还是企业2赢利,要看是哪一家企业首先行动。假定企业1具有较高的研究和开发优势,率先在市场上推出新产品,那么企业2的最佳反应就是不跟进,因为跟进的损失是7,不跟进的损失只有5。,博弈论和对策行为,最大最小策略(Max-min strategy),冯.诺依曼和摩根斯坦认为策略的选择与决策者的性格有关。 某些决策者可能认为,冒失行动容易造成重大失误,最好还是从最不利的情况出发,向最好的方向努力,力求做到有备无患。这样的决策者属于风险厌恶型的,他首先想到的是各种不利因素和风险,所以他先要考虑各种最坏的结果,然后从最坏结果中
7、选出一个最好结果。按这种原则选取的策略可以称为最大最小策略。,博弈论和对策行为,最大最小策略(Max-min strategy),例:假如企业1的决策者是求稳型的,他会这样考虑:不管对方采取什么策略,我不推出新产品最少可以得到收益-5,推出新产品最少可以得到收益-7,比较这两种策略,还是不推出新产品为好。假如企业2的决策者也是风险厌恶型的,他也有同样的思维方式:先从无新产品的决策中找出最小收益-5,再从有新产品的决策中找出最小收益-7,然后从两个最小收益中找最大收益为-5,相应的策略为无新产品。如果两家寡头企业的决策者都是这种风险厌恶型的,市场就没有新产品推出了。但是,(无新产品,无新产品)不
8、是纳什均衡,所以,这种对策结构是不稳定的。,博弈论和对策行为,最大最小策略(Max-min strategy),按最大最小原则选择的策略是一种求稳型策略,它不保证利润最大化,却能保证风险最小化。 在表11-2表示的企业价格博奕中,假如企业1按最大最小原则选择策略,它的最大最小策略是 “价格不变”,企业2的最大最小策略也是“价格不变”。(价格不变,价格不变)正是纳什均衡。,2.2.2 纳什均衡的一致预测性质,一致预测:如果所有博弈方都预测一个特定博弈结果会出现,所有博弈方都不会利用该预测或者这种预测能力选择与预测结果不一致的策略,即没有哪个博弈方有偏离这个预测结果的愿望,因此预测结果会成为博弈的
9、最终结果 只有纳什均衡才具有一致预测的性质 一致预测性是纳什均衡的本质属性 一致预测并不意味着一定能准确预测,因为有多重均衡,预测不一致的可能,2.2.3 纳什均衡与严格下策反复消去法,上策均衡肯定是纳什均衡,但纳什均衡不一定是上策均衡 命题2.1:在n个博弈方的博弈 中,如果严格下策反复消去法排除了除 之外的所有策略组合,那么 一定是该博弈的唯一的纳什均衡 命题2.2:在n个博弈方的博弈中 中,如果 是 的一个纳什均衡,那么严格下策反复消去法一定不会将它消去 上述两个命题保证在进行纳什均衡分析之前先通过严格下策反复消去法简化博弈是可行的,2.3 无限策略分析和反应函数,2.3.1 古诺的寡头
10、模型 2.3.2 反应函数 2.3.3 伯特兰德寡头模型 2.3.4 公共资源问题 2.3.5 反应函数的问题和局限性,2.3.1 古诺的寡头模型,基本模型,古诺特提出的模型中,两家公司关于同类产品在市场上竞争。 两家公司在市场上面临单纯的需求曲线,假设需求曲线为 Q = P 其中 0, 0。而Q = Q1 + Q2是由公司1和公司2生产的总量。需求曲线的另一种理解方式是,如果Q=Q1+Q2是双寡头自身之间生产的量,由此产生的价格是 我们通过记 和 来简化这个(逆)需求曲线的表达式;即,从这个观点出发我们将使用的逆需求函数为 P = a b Q,假设每家公司的成本函数相同,并且每单元成本不随生
11、产的单元数变化。更正规一些,每家公司具有常数边际成本函数;生产数量Qi的成本为cQi,其中c 0是常数边际成本,i = 1,2。 每家公司将生产多少?为做出该决策,每家公司必须采取两步: 1. 对另一家公司的生产量进行预测。这一步将给于公司一个有关可能的市场价格的想法;例如,如果它认为对手将生产大量产品,那么,不管它自己生产多少,价格将偏低。 2.决定生产的数量。为做出这个决定,公司必须权衡从增加产量得到的好处那样,它将出售较多产品以及这样做所需要的成本即,这些大量的产品将以较低价格出售(而它们不得不以较高的总成本生产)。当两家公司满意地解决了这两件事时,将得到工业范围的或纳什均衡。,古诺特-
12、纳什均衡,最大化利润的生产量 公司1最优反应函数,q1=q2=a-c/3,卡特尔解,作为对比,如果两个公司如卡特尔那样地运作,即,如果它们对于它们的生产决策进行协调,我们来计算它们将生产的产量,如果公司经营为卡特尔,可以合理地假设它们以最大化它们的联合利润或总利润这样的方式来设置生产目标。预先指定生产“配额”为Q1与Q2;它们的选择是使得总利润最大化:,每家公司的 价格 每家公司的 生产数量 利润 注意到如果公司如卡特尔那样经营,它们比起在纳什均衡里的产量生产得少一些;卡特尔的产量是古诺特-纳什均衡产量水平的75%。在纳什均衡中,两家公司比起它们象卡特尔那样经营来利润较低(因为在纳什均衡里,它
13、们过度地生产)。,案例:,寡头产量竞争以两厂商产量竞争为例,4.5,4.5,5,3.75,3.75,5,4,4,不突破,突破,厂商2,不突破,突破,厂 商 1,以自身最大利益为目标:各生产 2单位产量,各自得益为4 以两厂商总体利益最大:各生产 1.5单位产量,各自得益为4.5,两寡头间的囚徒困境博弈,2.3.2 反应函数,古诺模型的反应函数,理性局限和古诺调整,2.3.3 伯特兰德寡头模型,价格竞争寡头的博弈模型 产品无差别,消费者对价格不十分敏感,2.3.4 公共资源问题,公共草地养羊问题,以三农户为例 n=3,c=4,合作:总体利益最大化,竞争:个体利益最大化,2.4 混合策略和混合策略
14、纳什均衡,2.4.1 严格竞争博弈和混合策略的引进 2.4.2 多重均衡博弈和混合策略 2.4.3 混合策略和严格下策反复消去法 2.4.4 混合策略反应函数,2.4.1 严格竞争博弈和混合策略的引进,一、猜硬币博弈,(1)不存在前面定义的纳什均衡策略组合 (2)关键是不能让对方猜到自己策略 这类博弈很多,引出混合策略纳什均衡概念,二、混合策略、混合策略博弈 和混合策略纳什均衡,混合策略:在博弈 中,博弈方 的策略空间为 ,则博弈方 以概率分布 随机在其 个可选策略中选择的“策略”,称为一个“混合策略”,其中 对 都成立,且 混合策略扩展博弈:博弈方在混合策略的策略空间(概率分布空间)的选择看
15、作一个博弈,就是原博弈的“混合策略扩展博弈)。 混合策略纳什均衡:包含混合策略的策略组合,构成纳什均衡。,课堂练习,求出下面博弈的纳什均衡(含纯策略和混合策略)。,三、一个例子,该博弈无纯策略纳什均衡,可用混合策略纳什均衡分析,策略 得益 博弈方1 (0.8,0.2) 2.6 博弈方2 (0.8,0.2) 2.6,四、齐威王田忌赛马,五、小偷和守卫的博弈,小偷与守卫的博弈,由于对博弈论有卓越贡献而成为1994年诺贝尔经济学奖获得者的泽尔顿教授,1996年3月在上海的一次演讲中,举了这个小偷与守卫之间博弈的例子。故事的背景是这样的:一守卫看守一个仓库,一小偷要在夜晚去偷仓库的东西。但是守卫有可能
16、晚上睡觉也可能不睡,如果守卫睡觉,小偷偷窃就会成功,他将获得正效用V,而守卫由于失职,他将获得负效用D;而守卫如果不睡,守卫能抓住小偷,小偷将获得负效用P;而小偷也有可能不去偷,那样守卫如果睡觉,他获得正效用S。,例2.3.3 小偷与守卫的博弈(续),所以守卫有睡和不睡两种策略选择,小偷也有偷和不偷两种策略选择,他们的收益矩阵如下: 表2.3.1 小偷与守卫的收益矩阵 在该例中,显然不存在占优策略,则按本节介绍的方法来求纳什均衡。,小偷与守卫的博弈(续),由 得 (2.3.27) 由 得 (2.3.28),图2.3.3 小偷与守卫的纳什均衡点,小偷与守卫的博弈(续),可在上图中分别作出(2.3
17、.27)和(2.3.28)折线。同时满足(2.3.27)和(2.3.28)的点对只有唯一点N。于是,我们得到一个混合策略的纳什均衡点 。 小偷将以 的概率偷,以 的概率不偷;守卫以 的概率去睡觉,以 的概率不睡觉。也就是说,小偷去偷与否和守卫得到的效用有关,守卫睡觉与否和小偷得到的效用有关。比如说,如果小偷偷窃成功得到的效用V越大,间接说明仓库储藏的物品越重要,守卫越不去睡觉。其它情况可以类似分析。,加重对小偷的处罚:短期内能抑制盗窃发生率 长期并不能降低盗窃发生率,但会是的守卫更多的偷懒,加重对守卫的处罚:短期中的效果是使守卫真正尽职 在长期中并不能使守卫更尽职,但会降低盗窃发生的概略,法学
18、有时是一个悖论。例如,为了限制与毒品相关的犯罪,维护正常的经济秩序,立法者决定严厉打击贩毒、吸毒,这是否就能抑制与毒品相关的犯罪(这里所说的与毒品相关的犯罪是指为获得吸毒资金而采取的偷盗、抢劫、绑架等行为)呢?答案刚好相反。打击贩毒无形间提高了毒犯贩毒的机会成本。所谓机会成本是指人们为了获取某样东西而不得不放弃的东西。犯罪分子贩毒的机会成本可能是自由或生命。于是毒品市场上毒品的供给会因贩毒者心理的恐惧而减少,与此相反毒品的价格会大幅上升。瘾君子们为了获得毒品,不得不更多地冒险去用犯罪的手段获得金钱,这样与毒品相关的犯罪反而会日益猖獗,因为法学的思想不能解释毒品是没有弹性的商品,瘾君子一旦身陷其
19、中,便难以自拔。毒品不像水果那样,价格贵的时候大家就先不吃,等价格降下来再吃。无论毒品价格多高,毒品的需求量变动都不大,而价格升高必然使本来囊中羞涩的瘾君子“另谋它路”。,2.4.2 多重均衡博弈和混合策略,一、夫妻之争的混合策略纳什均衡,夫妻之争博弈的混合策略纳什均衡 策略 得益 博弈方1 (0.75,0.25) 0.67 博弈方2 (1/3,2/3) 0.75,二、制式问题,制式问题混合策略纳什均衡 A B 得益 厂商1: 0.4 0.6 0.664 厂商2: 0.67 0.33 1.296,三、市场机会博弈,进 不进 得益 厂商1: 2/3 1/3 0 厂商2: 2/3 1/3 0,2.
20、4.3 混合策略和严格下策反复消去法,2.4.4 混合策略反应函数,1, if q 1/2 , p = 0, if q 1/2 .,EUA = 1 p q + (-1) p (1- q) + (-1) (1- p) q + 1 (1- p) (1- q) = p q - p + p q - q +p q + 1 - p - q + p q = 4 p q - 2 p - 2 q + 1 = 2 p (2 q - 1) + (1 - 2 q ) ,and so we have As reaction function for B,0,1, if q = 1/2 ,Similarly, Bs re
21、action function for A 0, if p 1/2 , q = 1, if p 1/2 .,q 1,1 p,N,0,0, 1, if p = 1/2 ,夫妻之争博弈,夫妻之争博弈有三个解反应函数法的作用:能求出纯策略均衡。,2.5 纳什均衡的存在性,纳什定理:在一个由n个博弈方的博弈 中,如果n是有限的,且 都是有限集(对 ),则该博弈至少存在一个纳什均衡,但可能包含混合策略。 纳什均衡的普遍存在性正是纳什均衡成为非合作博弈分析核心概念的根本原因之一。,2.6 纳什均衡的选择和分析方法扩展,2.6.1 多重纳什均衡博弈的分析 2.6.2 共谋和防共谋均衡,假设双头垄断企业的成本
22、函数分别为: , ,市场需求曲线为, 其中, 。 求出古诺(Cournot)均衡情况下的产量、价格和利润。,2.6.1 多重纳什均衡博弈的分析,帕累托上策均衡 风险上策均衡 聚点均衡 相关均衡,一、帕累托上策均衡,这个博弈中有两个纯策略 纳什均衡,(战争,战争) 和(和平,和平),显然 后者帕累托优于前者,所 以,(和平,和平)是本 博弈的一个帕累托上策均衡。,多个纳什均衡的某一个给所有博弈方带来的得益都大于其他所有那好似均衡带来的得益,则各个博弈方都会倾向于此纳什均衡的策略,博弈能够实现帕雷托效率,称此纳什均衡为帕累托上策均衡。,帕累托最优标准 在其他条件不变的条件下,如果某一经济变动改善了
23、一些人的状况,同时又不使另一些人蒙受损失,这个变动就增进了社会福利,称为帕累托改进。,在其他条件不变的条件下,如果不减少一些人的经济福利,就不能改善另一些人的经济福利,就标志着社会经济福利达到了最大化状态,实现了帕累托最优状态。 可以说,帕累托最优状态是不存在帕累托改进的资源配置状态。,二、风险上策均衡,考虑、顾忌博弈方、其他博弈方可能发生错误等时,帕累托上策均衡并不一定是最优选择,需要考虑:风险上策均衡。下面就是两个例子。,三、聚点均衡,利用博弈设定以外的信息和依据选择的均衡 文化、习惯或者其他各种特征都可能是聚点均衡的依据 城市博弈(城市分组相同)、时间博弈(报出相同的时间)是聚点均衡的典
24、型例子,博弈方1 和博弈方 2就如何分 10,000 元钱进行讨价还价。假设确定了以下规则:双方同时提出自己要求的数额 A 和 B,0A,B10,000。如果 A+B10,000,则两博弈方的要求得到满足,即分别得 A 和 B,但如果 A+B10,000,则该笔钱就没收。 问该博弈的纳什均衡是什么?,城市博弈:聚点均衡的例子,这四个城市是: 上海、长春、哈尔滨、南京,四、相关均衡,三个纳什均衡: (U,L)、(D,R) 和混合策略均衡(1/2,1/2),(1/2,1/2) 结果都不理想,不如(D,L)。,可利用聚点均衡(天气,抛硬币),但仍不理想。,相关装置: 1、各1/3概率A、B、C 2、
25、博弈方1看到是否A,博弈方2看到是否C 3、博弈方1见A采用U,否则D;博弈方2见C采用R,否则L。,相关均衡要点: 1、构成纳什均衡 2、有人忽略不造成问题,一、多人博弈中的共谋问题 本博弈的纯策略纳什均衡:(U,L,A)、(D,R,B) 前者帕累托优于后者。博弈的结果会是什么呢? (U,L,A)有共谋 (Coalition)问题:博弈方1和2同时偏离。,2.6.2 共谋和防共谋均衡,二、防共谋均衡,如果一个博弈的某个策略组合满足下列要求: (1)没有任何单个博弈方的“串通”会改变博弈的结果,即单独改变策略无利可图; (2)给定选择偏离的博弈方有再次偏离的自由时,没有任何两个博弈方的串通会改变博弈的结果; (3)依此类推,直到所有博弈方都参加的串通也不会改变博弈的结果。 称为“防共谋均衡”。 前面例子中:(D,R,B) 是防共谋均衡 (U,L,A)不是防共谋均衡,
链接地址:https://www.31doc.com/p-2900581.html