欢迎来到三一文库! | 帮助中心 三一文库31doc.com 一个上传文档投稿赚钱的网站
三一文库
全部分类
  • 研究报告>
  • 工作总结>
  • 合同范本>
  • 心得体会>
  • 工作报告>
  • 党团相关>
  • 幼儿/小学教育>
  • 高等教育>
  • 经济/贸易/财会>
  • 建筑/环境>
  • 金融/证券>
  • 医学/心理学>
  • ImageVerifierCode 换一换
    首页 三一文库 > 资源分类 > PPT文档下载
     

    博弈论及其在经济管理中的应用.ppt

    • 资源ID:3037233       资源大小:798.52KB        全文页数:61页
    • 资源格式: PPT        下载积分:8
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录 QQ登录   微博登录  
    二维码
    微信扫一扫登录
    下载资源需要8
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    博弈论及其在经济管理中的应用.ppt

    2019/6/28,1,博弈论及其在经济管理中的应用 教学课件,2019/6/28,2,第2章 纳什均衡,本章分析博弈论的解。所谓博弈的解,是指找出一个博弈最后的均衡和均衡结果,也就是说,给定每个局中人都是理性的以及每个局中人都知道每个局中人都是理性的,什么是每个局中人的最优策略?什么是所有局中人的最优策略组合? 本章考虑的是:首先,局中人同时选择行动,然后根据局中人的选择,每个局中人得到各自的得益(一定的收益或支出)。在这类静态(或同时行动)博弈中,我们的分析只局限于完全信息博弈,即对所有局中人,每个局中人的得益函数(该函数决定了局中人从选择的行动组合中得到的得益)是共同知识。,2019/6/28,3,本章分3节,2. 1 囚徒困境与占优均衡 2. 2 纳什均衡 2. 3 混合战略,2019/6/28,4,2.1囚徒困境与占优均衡,2.1.1 囚徒困境 2.1.2 重复剔除严格劣策略和占优均衡,2019/6/28,5,-5, -5,0, -8,-8, 0,-1, -1,沉默,招供,沉默,招供,两个囚徒的得益矩阵,囚徒2,囚徒1,囚徒1:招供 囚徒2:招供,囚徒困境的标准型表述 :,-5, -5,0, -8,-8, 0,-5, -5,0, -8,-6, -6,0, -9,-1, -1,-9, 0,2.1.1囚徒困境,2019/6/28,6,解博弈的第一个方法就是划线法,在两人博弈中,我们首先给定一个局中人的选择,考察另一个局中人的最优策略选择,在其最优策略选择的得益数字下面划一横线。然后,在给定另一个局中人的策略选择,看看前一个局中人的最优策略选择,在其最优策略选择的得益数字下面划一横线。,两个囚徒的得益矩阵,-6, -6,0, -9,-9,0,-1, -1,囚徒2,招供,沉默,招供,沉默,囚徒1,根据划线法对囚徒困境得益矩阵解得的博弈如右图所示,2019/6/28,7,囚徒困境,囚徒A,囚徒 B,坦白,抵赖,坦白,抵赖,-8大于-10 0大于-1,-8大于-10 0大于-1,2019/6/28,8,含义:囚徒困境反应了一个很深刻的问题,即个人理性与集体理性之间的矛盾。显然,如果每个人都选择沉默抵赖,各判刑一年,比都判刑6年要好。不过,这个帕累托改进做不到,因为它不满足个人理性的要求,(沉默,沉默)不是一个均衡。,2019/6/28,9,2.1.2 重复剔除严格劣策略和占优均衡,占优策略(dominant strategy):在囚徒困境中,我们发现,一个局中人的最优策略选择不依赖另一个局中人的策略选择,即无论其他局中人选择什么策略,他的最优策略是唯一的(在囚徒困境中,如果双变量矩阵中的得益的具体数字0,-1,-6,-9换成任意的T、R、P、S,只要满足T R P S,上述结论依然成立),我们把这样的最优策略称为“占优策略”(dominant strategy)。在这里,招供是两个嫌疑犯的占优策略。,2019/6/28,10,占优战略均衡(Dominant-Strategy),占优策略:不论其他人选择什么战略,参与人的最优战略是唯一的,这样的最优战略称为“占优策略”(dominant strategy)。,2019/6/28,11,占优策略均衡 定义:在博弈的策略表达式中,如果对于所有的i,Si*是i的占优策略,下列策略组合称为占优策略均衡:,2019/6/28,12,定义2.1严格劣策略:在标准型博弈GS1,Sn;u1,un中,令si和si代表局中人i的两个可行策略(即是Si中的元素)。如果对其他局中人每一个可能的策略组合,i选择si的收益都小于其选择si的收益,则称策略si相对于策略si是严格劣策略: 对其他局中人在其策略空间S1,S i1,,Sn中每一组可能的策略(s1,si1,,sn)都成立。,2019/6/28,13,等待,小猪,大猪,按,等待,按,案例:智猪博弈,大猪有无严格占优策略?,2019/6/28,14,重复剔除严格劣策略博弈的例子 :,剔除顺序由箭头所示,2019/6/28,15,定义2.2占优均衡:在标准型博弈GS1,Sn;u1,un中,如果对于所有的i, si是局中人i的占优策略,那么,策略组合s=(s1, ,sn)称为占优均衡(dominantstrategy equilibrium)。如果它是重复剔除严格劣策略后剩下的策略组合,策略组合s=(s1, ,sn) 称为重复剔除的占优均衡。如果这种唯一的策略组合是存在的,我们就说该博弈是重复剔除占优可解的。,2019/6/28,16,重复剔除的占优均衡(Iterated Elimination of Strictly Dominated Strategies),M,列先生,行先生,U,D,L,R,行:没有占优策略 列:M严格优于R 剔除 R,行:L优于D 列:无占优策略 剔除 D,M优于L,(U,M)是重复剔除的占优均衡,2019/6/28,17,练习:在下列策略式表达中,找出重复剔除的占优均衡,C2,R1,R2,C1,C3,R3,2019/6/28,18,重复剔除严格劣策略过程建立在理性局中人不会选择严格劣策略这一合情合理的原则之上,每一步剔除都需要局中人间相互了解的更进一步假定,如果我们要把这一过程应用到任意多步,就需要假定“局中人是理性的”是共同知识。 重复剔除严格劣策略的第二个缺陷在于这一方法对博弈结果的预测经常是不准确的。,2019/6/28,19,2.2纳什均衡,2.2.1 纳什均衡的定义 2.2.2 纳什均衡的性质,2019/6/28,20,纳什均衡概念是现代博弈论的核心概念。它是以美国数学家、经济学家纳什(Nash)的名字命名的,纳什在1950年的一篇论文中提出了纳什均衡的概念。,2019/6/28,21,纳什均衡(Nash Equilibrium),通俗地说,纳什均衡的含义就是: 给定你的策略,我的策略是最好的策略;给定我的策略,你的策略也是你的最好的策略。即双方在给定的策略下不愿意调整自己的策略。,2019/6/28,22,2.2.1 纳什均衡的定义,策略空间: 局中人 的第 个策略: 局中人 的得益: 博弈: 纳什均衡:在n个局中人标准型博弈 中,如果由各个局中人的各一个策略组成的某个策略组合 中,任一局中人 的策略,都是对其余局中人策略的组合 的最佳对策,也即 对任意 都成立,则称 为 的一个纳什均衡,2019/6/28,23,例1 根据划线法得出纳什均衡,如果在一对策略中,每一局中人的策略都是对方策略的最优反应策略,则这对策略满足不等式的条件(亦即双变量矩阵相应单元的两个收益值下面都被划了横线)。这样,(下,右)是惟一一对满足纳什均衡的策略组合。,2019/6/28,24,寻找纳什均衡,C2,R1,R2,C1,C3,R3,参与人B,参与人A,(R3,C3)是纳什均衡,2019/6/28,25,练习: 找出下列两队夫妻的纳什均衡,死了,恩爱夫妻,活着,死了,活着,死了,妻子,相互仇恨夫妻,活着,死了,活着,妻子,丈夫,丈夫,2019/6/28,26,市场进入阻挠,斗争,在位者,进入者,进入,不进入,默许,纳什均衡:进入,默许;不进入,斗争,用重复剔除弱劣策略的方法找均衡,2019/6/28,27,2.2.2 纳什均衡的性质,纳什均衡与占优均衡的关系 命题2.1:在有n个局中人的标准型博弈GS1,Sn;u1,un中,如果重复剔除严格劣策略剔除除策略组合s1*,,sn*外的所有策略,那么这一策略组合为该博弈的惟一纳什均衡,反之则不一定。即纳什均衡一定是重复剔除严格劣策略的过程完成后没有被剔除的策略组合,但没有被剔除的策略组合不一定是纳什均衡,除非它是唯一的。,2019/6/28,28,纳什均衡与严格剔除劣战略,占优均衡肯定是纳什均衡,但纳什均衡不一定是占优均衡 在n个博弈方的博弈 中,如果严格剔除劣战略排除了除 之外的所有策略组合,那么 一定是该博弈的唯一的纳什均衡 在n个博弈方的博弈中 中,如果 是 的一个纳什均衡,那么严格剔除劣策略一定不会将它剔除 上述两个命题保证在进行纳什均衡分析之前先通过严格下策反复消去法简化博弈是可行的,2019/6/28,29,不同均衡概念的关系,占优均衡 DSE,重复剔除占优均衡 IEDE,纯战略纳什均衡 PNE,2019/6/28,30,纳什均衡的存在性 命题2.2:在n个局中人的标准型博弈GS1,Sn;u1,un中,如果n是有限的,且对每个i,Si是有限的,则博弈存在至少一个纳什均衡,均衡可能包含混合策略。,2019/6/28,31,纳什均衡的多重性,例2-在此情侣博弈中 有两个均衡:(芭蕾,芭蕾)和(足球,足球)都是纳什均衡,例3-市场进入博弈 这个博弈也有两个纳什均衡:(进入,默许)和(不进入,斗争),2019/6/28,32,2.3 混合策略,2.3.1 混合策略的含义 2.3.2 纳什均衡的扩展,2019/6/28,33,社会福利博弈,流浪,流浪汉,政府,救济,不救济,寻找工作,没有一个战略组合构成纳什均衡,2019/6/28,34,反面,正面,反面,正面,猜谜游戏 两个儿童各拿一枚硬币, 若同时正面朝上或朝下,A给B 1分钱, 若只有一面朝上,B给A 1分钱。,零和博弈 博弈参与者有输有赢,但结果永远是0。,没有一个战略组合构成纳什均衡,2019/6/28,35,警察与小偷,银行,酒馆,警察,小偷,2万元,1万元,东边,西边,警察与小偷的最优策略各是什么?,2019/6/28,36,上述博弈的特征是: 在这类博弈中,都不存在纯纳什均衡。 参与人的支付取决于其他参与人的战略;以某种概率分布随机地选择不同的行动 每个参与人都想猜透对方的战略,而每个参与人又不愿意让对方猜透自己的战略。 这种博弈的类型是什么?如何找到均衡?,2019/6/28,37,请举一些这样的例子:,石头、剪子、布游戏 老虎、杠子、鸡、虫子游戏 扑克游戏 橄榄球赛 战争中,2019/6/28,38,策略:参与人在给定信息集的情况下选择行动的规则,它规定参与人在什么情况下选择什么行动,是参与人的“相机行动方案”。 纯策略:如果一个策略规定参与人在每一个给定的信息情况下只选择一种特定的行动,该战略为纯策略。 混合策略:如果一个策略规定参与人在给定信息情况下以某种概率分布随机地选择不同的行动,则该策略为混合策略。 纯策略可以理解为混合策略的特例,即在诸多策略中,选该纯策略si的概率为1,选其他纯策略的概率为0。,2019/6/28,39,2.3.1 混合策略的含义,混合策略的含义 假设局中人i有K个纯策略:Si=sil,sik,则局中人i的一个混合策略是一个概率分布(Pil,Pik),其中Pik表示对所有k=1,,K,局中人i选择策略sik的概率,由于pik是一个概率,对所有k=1,K,有0pik1且Pil+Pik=1。我们用Pi表示基于Si的任意一个混合策略,其中包含了选择每一个纯策略的概率,正如我们用si表示Si内任意一个纯策略一样。,定义2.4混合策略: 对标准型博弈G=S1,,Sn;u1,un,假设Si=sil,,sik。那么,局中人i的一个混合策略为概率分布pi=(pil,pik),其中对所有k=1,,K,0Pik1,且pil+pik=1。,2019/6/28,40,西边,东边,西边,东边,警察抽签决定去银行还是酒馆,2/3的机会去银行,1/3的机会去酒馆; 同样,小偷也抽签决定去银行还是酒馆, 2/3的机会去酒馆, 1/3的机会去银行。,2019/6/28,41,社会福利博弈,流浪,流浪汉,政府,救济,不救济,寻找工作,设:政府救济的概率:1/2 ;不救济的概率:1/2。 流浪汉:寻找工作的期望效用:1/2×2+1/2 ×1=1.5 流浪的期望效用: 1/2×3+1/2 ×0=1.5 因此,流浪汉的任何一种战略都是都是对政府混合战略的最优反应,2019/6/28,42,社会福利博弈,流浪,流浪汉,政府,救济,不救济,寻找工作,设:政府救济的概率:1/2 ;不救济的概率:1/2。 流浪汉:寻找工作的概率:0. 2;流浪的概率:0.8 每个参与人的战略都是给定对方混合战略时的最优战略,2019/6/28,43,反面,正面,反面,正面,猜谜游戏 两个小孩的最优策略是采取每个策略的可能性均为1/2; 每个小孩各取策略的1/2是纳什均衡。,零和博弈,2019/6/28,44,猜硬币博弈,猜硬币博弈一个非常突出的特点 每个局中人都试图能先猜中对方的策略,2019/6/28,45,2.3.2 纳什均衡的扩展,猜硬币博弈严格竞争博弈和混合策略的引进,(1)不存在前面定义的纳什均衡策略组合 (2)关键是不能让对方猜到自己策略 这类博弈很多,引出混合策略纳什均衡概念,2019/6/28,46,扩展的纳什均衡的正式定义,如果局中人1推断局中人2将以(P21,P2k)的概率选择策略(s21,s2k),则局中人1选择纯策略s1j的期望收益为: (2.1) 且局中人1选择混合策略p1(p11,p1J)的期望收益为: (2.2) 其中,这p1j×p2k表示局中人1选择s1j且局中人2选择s2k的概率。,2019/6/28,47,如何寻找混合策略纳什均衡? 支付最大化法 支付等值法 由于混合战略伴随的是支付的不确定性,因此参与人关心的是其期望效用。 最优混合策略:是指使期望效用函数最大的混合战略(给定对方的混合战略) 在两人博弈里,混合策略纳什均衡是两个参与人的最优混合策略的组合。,2019/6/28,48,流浪,流浪汉,政府,救济,不救济,寻找工作,即:流浪汉以0.2的概率选择寻找工作,0.8的概率选择游荡,同样,可以根据流浪汉的期望效用函数找到政府的最优混合战略。?,支付最大化法,2019/6/28,49,社会福利博弈,流浪,流浪汉,政府,救济,不救济,寻找工作,设:政府救济的概率:1/2 ;不救济的概率:1/2。 流浪汉:寻找工作的概率:0. 2;流浪的概率:0.8 每个参与人的战略都是给定对方混合战略时的最优战略,2019/6/28,50,假定最优混合战略存在,给定流浪汉选择混合战略, 政府选择纯战略救济的期望效用为: 选择纯战略不救济的效用为: 如果一个混合战略(而不是纯战略)是政府的最优选择,一定意味着政府在救济与不救济之间是无差异的。,流浪,流浪汉,政府,救济,不救济,寻找工作,支付等值法,2019/6/28,51,社会福利博弈,流浪,流浪汉,政府,救济,不救济,寻找工作,设:政府救济的概率:1/2 ;不救济的概率:1/2。 流浪汉:寻找工作的概率:0. 2;流浪的概率:0.8 每个参与人的战略都是给定对方混合战略时的最优战略,2019/6/28,52,对 的解释:如果流浪汉以找工作的概率小于0.2, 则政府选择不救济,如果大于0.2,政府选择救济 ,只有当概率等于0.2时,政府才会选择混合战略或任何纯战略. 对*=0.5的解释:如果政府救济的概率大于0.5,流浪汉的最优选择是流浪,如果政府救济的概率小于0.5,流浪汉的最优选择是寻找工作.,2019/6/28,53,混合战略纳什均衡的含义: 纳什均衡要求每个参与人的混合战略是给定对方的混合战略下的最优选择。因此在社会福利博弈中, , *=0.5是唯一的混合战略纳什均衡。 从反面来说,如果政府认为流浪汉选择寻找工作的概率严格小于0.2,那么政府的唯一最优选择是纯战略:不救济; 如果政府以1的概率选择不救济,流浪汉的最优选择是寻找工作,这又将导致政府选择救济的战略,流浪汉则选择游荡。如此等等。,2019/6/28,54,2019/6/28,55,扩展的纳什均衡的正式定义: 定义2.5:在两个局中人标准型博弈G=S1,S2;u1,u2中,混合策略(p1*,p2*)是纳什均衡的充要条件为:每一局中人的混合策略是另一局中人混合策略的最优反应,即(2.4)和(2.5)必须同时成立。,2019/6/28,56,练习:模型化下述划拳博弈: 两个老朋友在一起喝酒,每个人有四个纯战略:杠子、老虎、鸡和虫子,输赢规则是:杠子降虎鸡,虎吃鸡,鸡吃虫子,虫子降杠子,两人同时出令。如果一个打败另一个,赢的效用为1,输的效用为-1,否则效用为0,写出这个博弈的支付矩阵,这个博弈有纯策略均衡吗?计算其混合战略纳什均衡。,2019/6/28,57,不同均衡概念的关系,占优均衡 DSE,重复剔除占优均衡 IEDE,纯战略纳什均衡 PNE,混合战略纳什均衡 MNE,2019/6/28,58,总结:求解一个博弈的一般的思路,在任何一个博弈中,每个局中人决策的根本原则是最大化自己的效用(或得益)。由于一个局中人的得益不仅取决于自己所选择的策略,还决定于其他局中人所选择的策略,因此,每个局中人在决策时必须考虑其他局中人的存在和他们的反应。据此,一个局中人能够做的是针对其他局中人的每种策略(在多个局中人参加的博弈中,则是他们的每种策略组合),找出自己的最佳对策,即自己所有的可选择策略中与其他局中人的该种策略或策略组合配合使自己得益(效用)最大的一种策略(有时可能有几种)。,2019/6/28,59,2.4 习 题,1占优均衡、重复剔除劣策略占优均衡和纳什均衡相互之间的关系是什么?,2求解如图1所示的策略式博弈的纯策略纳什均衡。,2019/6/28,60,3试用重复剔除劣策略的方法求解如图2所示的策略型博弈的纯策略纳什均衡。,4在如图3所示的策略式博弈中,当a,b,c之间满足什么条件时,该博弈: (1)存在占优策略纳什均衡; (2)存在重复剔除的占优策略纳什均衡; (3)存在纯策略纳什均衡; (4)存在混合策略纳什均衡。,2019/6/28,61,5考察“智猪博弈”猪圈里圈养两头猪,一头大猪、一头小猪。猪圈的一端有一个猪食槽,另一头安装一个按钮,控制着猪食的供应,按一下按钮会有10个单位的猪食进槽,但谁按按钮谁就需要付出2个单位的成本且比对方晚到食槽。若大猪先到食槽,大猪吃9个单位,小猪只能吃1个单位;若同时到,大猪吃7个单位小猪吃3个单位;若小猪先到,大猪吃6个单位,小猪吃4个单位。 (1)试给出上述博弈的策略式描述 (2)求解该博弈的纳什均衡; (3)试用上述博弈模型解释为什么在市场上只有大 企业才会花钱打广告。,

    注意事项

    本文(博弈论及其在经济管理中的应用.ppt)为本站会员(本田雅阁)主动上传,三一文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一文库(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    经营许可证编号:宁ICP备18001539号-1

    三一文库
    收起
    展开