《博弈论基础》PPT课件.ppt
《《博弈论基础》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《博弈论基础》PPT课件.ppt(244页珍藏版)》请在三一文库上搜索。
1、1,An introduction to Game Theory,博弈论基础,世事洞明皆学问 人情练达即文章,2,3,4,5,启示:,6,博弈的划分:,7,静态博弈经常是一次性的行为,决策一旦作出就不能再更改结果。动态博弈有一个重复的性质,前边的所有信息影响到后边的决策,博弈的结果要经过多次博弈之后才能看到,所以是一个连续的过程,这就决定了同一参与者在动态博弈时和静态博弈时表现出不同的行为。如果把为人处世看作一个博弈过程,我们就会发现静态博弈和动态博弈的区别。,8,比如说一个坏人,他遇到了一个他从来都没遇到过的人而且以后再也不会和他见面的陌生人,他就可能会变得肆无忌惮,本来的面目暴露无遗,因为
2、这种情况是静态博弈,是一锤子买卖。同样一个坏人又会在经常打交道的人面前伪装成好人,因为这种情况是动态博弈,前边的所有信息会影响到后边的决策。为了自己的长远利益,他现在必须极力制造一些虚假的信息,让后边的决策对自己更加有利,所以见面时会很客气,表现得很好,以便让别人后边的行动不要对自己不客气。,9,例:猎人与猎狗的博弈,10,第三章 完全且完美信息的动态博弈,本章讨论动态博弈,所有博弈方都对博弈过程和得益完全了解的完全且完美信息动态博弈。这类博弈也是现实中常见的基本博弈类型。由于动态博弈中博弈方的选择、行为有先后次序,因此在表示方法、利益关系、分析方法和均衡概念等方面,都与静态博弈有很大区别。本
3、章对动态博弈分析的概念和方法,特别是子博弈完美均衡和逆推归纳法作系统介绍,并介绍各种经典的动态博弈模型.,11,如果各方对各种局势下所有局中人的得益状况完全清楚,称为完全信息博弈。反之为不完全信息博弈。在动态博弈中还有一类信息:轮到行动的博弈方是否完全了解此前对方的行动。如果完全了解则称之为“具有完美信息”的博弈。反之称为“不完美信息的动态博弈”。由于信息不完美,博弈的结果只能是概率期望,而不能像完美信息博弈那样有确定的结果。,12,本章分六节,3.1动态博弈的表示法和特点 3.2可信性和纳什均衡的问题 3.3子博弈和子博弈完美纳什均衡 3.4几个经典动态博弈模型 3.5有同时选择的动态博弈模
4、型 3.6动态博弈分析的问题和扩展讨论,13,3.1 动态博弈的表示法和特点,3.1.1 阶段和扩展性表示 3.1.2 动态博弈的基本特点,14,3.1.1 阶段和扩展性表示,阶段:动态博弈中一个博弈方的一次选择行为 例子:仿冒和反仿冒博弈,15,3.1.2 动态博弈的基本特点,策略是在整个博弈中所有选择、行为的计划 结果是上述“计划型”策略的策略组合,构成一条路径 得益对应每条路径,而不是对应每步选择、行为 动态博弈的非对称性先后次序决定动态博弈必然是非对称的。 先选择、行为的博弈方常常更有利,有“先行优势”。,16,战略式表述(strategic form representation)多
5、用矩阵,2 L S,L S,1,扩展式表述(extensive form representation)多用博弈树,战略式与扩展式,17,1.1.2.1动态博弈扩展式表述,一般以扩展型式来表示:G=(N,H,P,I,U),包括5要素: (1)局中人N; (2)历史H:博弈树是一个多环节与枝干的集合,从单一的起始环节,直到终结环节,代表博弈历史; (3)对每个环节的分配法则P:将每个环节(除终结环节外)分配给不同的局中人,并赋予行动时可选的策略; (4)局中人行动时的信息集合I; (5)对应局中人可能选择策略,各局中人在终结环节所得到的报酬U。,18,博弈的扩展式表述包括三个要素: 参与人集合
6、每个参与人的战略集合 由战略组合决定的每个参与人的支付,19,动态博弈的基本构造,1结(nodes):结包括决策结(decition nodes)和终点结(terminal nodes)两类。决策结是参与人采取行动的时点,终点结是博弈行动路径的终点。 在博弈树中,“谁在什么时候行动”用在决策结旁边标注参与人的办法来表示。参与人的支付标注在博弈树终点结处。 2枝(branches):在博弈树上,枝是从一个决策结到它的直接后续结的连线,每一个枝代表参与人的一个行动选择。 3信息集(information sets):博弈树上的所有决策结分割成不同的信息集。每一个信息集是决策结集合的一个子集。该子集
7、包括所有满足下列条件的决策结:(1)每一个决策结都是同一参与人的决策结;(2)该参与人知道博弈进入该集合的的某个决策结,但不知道自己究竟处于哪一个决策结。,20,结nodes,信息集分单节信息集和多节信息集;如果用虚线匡起来表示2知道自己位于信息集内,但不知道是哪一点,因为他没能观察到对手的行动;如果博弈树的所有信息集都是单结的,称为完美信息博弈,21,完美信息(perfect information)与 不完美信息(imperfect information),不完美信息:2不能区分1是采用了L还是S,完美信息:2能区分1是选择了L还是S,22,案例- 房地产开发项目-假设有A、B两家开发商
8、 市场需求:可能大,也可能小 投入:1亿,假定市场上有两栋楼出售: 需求大时,每栋售价1.4亿, 需求小时,售价7千万; 如果市场上只有一栋楼 需求大时,可卖1.8亿 需求小时,可卖1.1亿,23,A,开发,不开发,N,N,大,小,1/2,1/2,大,小,1/2,1/2,B,B,B,B,开发,不开发,开发,不开发,开发,不开发,开发,不开发,(4,4),(8,0),(-3,-3),(1,0),(0,8),(0,0),(0,1),(0,0),参与人集合 参与人行动顺序 参与人的行动空间 参与人的信息集 参与人的支付函数 外生事件的概率分布,房地产开发博弈,24,A,开发,不开发,N,N,大,小,
9、1/2,1/2,大,小,1/2,1/2,B,B,B,B,开发,不开发,开发,不开发,开发,不开发,开发,不开发,(4,4),(8,0),(-3,-3),(1,0),(0,8),(0,0),(0,1),(0,0),B在决策时不确切地知道自然的选择; B的决策结由4个变为2个,房地产开发博弈,25,A,开发,不开发,N,N,大,小,1/2,1/2,大,小,1/2,1/2,B,B,B,B,开发,不开发,开发,不开发,开发,不开发,开发,不开发,(4,4),(8,0),(-3,-3),(1,0),(0,8),(0,0),(0,1),(0,0),B知道自然的选择;但不知道A的选择(或A、B同时决策),房
10、地产开发博弈,26,例:“人不犯我,我不犯人;人若犯我,我必犯人”的动态表示,27,3.1.2.2 动态博弈的战略式表述,不开发,开发商A,开发,不开发,开发,不开发,开发商B,开发商A,开发,不开发,开发,开发商B,需求小的情况,需求大的情况,博弈的战略式表述,28,A,B,(进入,进入),进入,不进入,(进入,不进入),(不进入,进入),(不进入,不进入),市场进入博弈的战略式,市场进入的扩展式,29,在市场进入博弈中:A有两个行动:“进入”、“不进入”。 由于是先行动者,只有两个战略:选择“进入”或“不进入”。 B有两个行动:“进入”、“不进入”。 但是,有4个战略:,(1)若A选择“进
11、入”,B选择“进入”,若A选择“不进入”,B选择“进入”,即 (进入,进入) (2)若A选择“进入”,B选择“进入”,若A选择“不进入”,B选择“不进入”,即 (进入,不进入),(3)若A选择“进入”,B选择“不进入”,若A选择“不进入”,B选择“不进入”,即 (不进入,进入) (4)若A选择“进入”,B选择“不进入”,若A选择“不进入”,B选择“不进入”,即 (不进入,不进入),30,练习:,31,32,扩展式表述动态博弈,若A先行动,B在知道A的行动后行动,则A有一个信息集,两个可选择的行动,战略空间为:(开发,不开发); B有两个信息集,四个可选择的行动,B有四个纯战略: 开发策略:不论
12、A开发不开发,我开发; 追随策略:A开发我开发,A不开发我不开发; 对抗策略:A开发我不开发,A不开发我开发; 不开发策略:不论A开发不开发我不开发 简写为:(开发,开发),(开发,不开发),(不开发,开发),(不开发,不开发),括号内的第一个元素对应A选择“开发”时B的选择,第二个元素对应A选择“不开发”时B的选择。,什么是参与人的战略?,33,扩展式表述动态博弈,足球,男的策略:足球,芭蕾 选择足球;还是选择芭蕾。 女的策略: (足球,芭蕾),(芭蕾,足球) (芭蕾,芭蕾),(足球,足球) 1、追随策略:他选择什么,我就选择什么 2、对抗策略:他选择什么,我就偏不选什么 3、芭蕾策略:不管
13、他选什么,我都选芭蕾; 4、足球策略:不管他选什么,我都选足球。,策略即:如果他选择什么,我就怎样行动的相机行动方案。在扩展式博弈里,参与人是相机行事,即“等待”博弈到达一个自己的信息集(包含一个或多个决策结后,再采取行动方案。,34,3.2 可信性和纳什均衡的问题,3.2.1 相机选择和策略中的可信性问题 3.2.2 纳什均衡的问题,35,3.2.1相机选择和策略中的可信性问题,与静态博弈不同,在动态博弈情形,“战略”不等同于“行动”。在动态博弈中,在每一个信息集上有一个行动选择的问题,而一个局中人在由他进行行动选择的所有信息集所进行的行动选择构成他的一个战略,即战略是行动选择的一个谱系,一
14、个战略规定了局中人在由他进行选择的所有信息集上所要选择的行动,即局中人在博弈开始之前所制定出的一个“相机行动计划”,它表明“如果发生,我将选择。”,36,当博弈是动态进行的时,与静态博弈相比,局中人就有了一种额外的选择,即事后机会主义。如果博弈是静态的,则局中人所声明的行动选择就是他们实际进行的选择,但是,如果博弈在行动选择上局中人有选择行动的先后顺序,那么,一些轮到稍后进行行动选择的局中人完全可以不按事前所声明的战略所规定的行动选择选择其行动,而是根据博弈进行到此时对局中人最为有利的方式选择行动。,37,这就是说,在动态博弈中,即使局中人按事前所声明的战略组合构成一个纳什均衡,而这些均衡战略
15、又规定了各个局中人在其所有信息集上的行动选择,这些行动选择也可能并非局中人在对应信息集上的最优行动选择。而当博弈实际进行到那些由纳什均衡战略规定的行动并非最优行动选择的信息集时,按照理性人假设,可以预言局中人届时不会按纳什均衡战略所规定的方式去选择行动,而是机会主义地选择最优的行动。这样,具有这种特点的纳什均衡就是不可信的,即不能作为模型的预测结果,按照“精炼”纳什均衡的思想,应当将其消掉。,38,不同版本的开金矿博弈分钱和打官司的可信性,39,第三种开金矿博弈中, (不借-不打,不分)和(借-打,分)都是纳什均衡。但后者不可信,不可能实现或稳定。 结论:纳什均衡在动态博弈可能缺乏稳定性,也就
16、是说,在完全信息静态博弈中稳定的纳什均衡,在动态博弈中可能是不稳定的,不能作为预测的基础。 根源:纳什均衡本身不能排除博弈方策略中包含的不可信的行为设定,不能解决动态博弈的相机选择引起的可信性问题,40,女儿,父母,断绝关系,跳楼,不伤心,嫁张三,父母,父亲与女儿的动态博弈,女儿可以选择嫁给张三或者不嫁给张三,父母则威胁女儿要是嫁给张三就不给嫁妆,并断绝父女关系,另外一种可能当然是不断绝父女关系。女儿则说如果断绝父女关系就要跳楼,另一种选择是不跳楼。父母则说如果你跳楼了,我们也不会感到痛苦。,41,问题是 :父亲的威胁是可置信的吗? 结果:女儿会勇敢的恋爱下去直到结婚,父亲最终会承认那个他当初
17、不喜欢的女婿。-完全信息动态子博弈精炼纳什均衡,42,“破釜沉舟”:项羽与秦兵交战,领兵过河后就砸锅沉船,就是一种承诺行动。 朝鲜开战的威胁是可置信的吗? 为什么画家死后的画会升值? 结婚为什么要送钻石? 婚姻中的承诺:彩礼、昂贵的婚礼可以理解为一种对婚姻的承诺; 订金、抵押物做为对交易的承诺; “安营扎寨”; 固定资产投资可以作为承诺; 所有权的承诺作用;,43,最惠条款,生产耐用品的企业经常被“降价预期”所困扰:如果消费者预期企业将降价,他们将会等待,结果,企业只能降价。如汽车行业面临的问题; 最惠条款可以起到承诺的作用:企业不会降价了。,44,美国普林斯顿大学古尔教授在1997年的经济学
18、透视里发表文章,提出一个例子说明威胁的可信性问题: 两兄弟老是为玩具吵架,哥哥老是要抢弟弟的玩具,不耐烦的父亲宣布政策:好好去玩,不要吵我,不管你们谁向我告状,我都把你们两个关起来,关起来比没有玩具更可怕。现在,哥哥又把弟弟的玩具抢去玩了,弟弟没有办法,只好说:快把玩具还我,不然我就要去告诉爸爸。各个想,你真要告诉爸爸,我是要倒霉的,可是你不告状不过没有玩具玩,而告了状却要被关禁闭,告状会使你的境遇变得更坏,所以你不会告状,因此哥哥对弟弟的警告置之不理。,45,的确,如果弟弟是会算计自己利益的理性人,在这样的环境下,还是不告状的好。可见,弟弟是理性人,他的告状威胁是不可置信的。,46,不可置信
19、的威胁引出了信息经济学中一个很种要的概念:承诺行动 承诺行动是当事人使自己的威胁战略变得的可置信的行动. 一种威胁在什么时候可是可信的: 只有在当事人若不 施行这种威胁时就会遭受更大的损失的 时候。 承诺是将不可置信的威胁变成可置信的威胁的行动:威胁不仅是事前最优的,也是事后最优的。,47,什么是承诺行动,如果一个局中人对已有博弈的均衡感到不满意,他(她)可以通过改变其行动空间从而导致其战略空间发生相应的变化来避开他不满意的均衡并获取其所需的均衡。 当在一个博弈中,倘若某局中人希望一个本属含有不可置信威胁或承诺的行动的非精炼均衡能真正发生,他可以通过改变其行动空间(通常是减小其行动空间或战略空
20、间)使其威胁或承诺变得不可置信,从而将原本非精炼的均衡变成精炼的均衡(战略或行动空间改变后,博弈本身也改变了),这类局中人改变其行动或战略空间的行为被称为“承诺行动”,48,有些战略之所以不是精练纳什均衡,是因为它包含了不可置信的威胁战略,如果参与人能在博弈之前采取某种行动改变自己的行动空间或支付函数,原来不可置信威胁将变得可置信,博弈的精练纳什均衡也会随之改变. 这些为改变博弈结果而采取的措施称为承诺行动. 完全承诺:承诺可以使某项行动完全没有可能(破釜沉舟). 不完全承诺:承诺只是增加了某个行动的成本而不是使该活动完全没有可能.,49,50,承诺行动(1)项羽的破釜成舟,秦朝末年,反秦义军
21、在新上任的统帅项羽的率领下,渡过大河与秦军精锐主力决战。当时的情况是,秦军主力是由名将章钳率领的精锐之师,而项羽统领的义军是一群缺乏训练,给养不足的乌合之众,且项羽本人又是刚刚通过斩了统帅宋义而自任统帅上台的,军心欠稳。两军相比,秦军无论在人数、装备及给养,还是士兵素质方面都远强于义军。一般人都会认为义军不是章钳大军的对手(宋义是在义军统帅项梁去世后接替项梁而出任义军统帅的,但在决战前夕就是因此顾虑而终日饮酒不敢出战被愤怒中的猛士项羽所杀)。这样,决定战争胜负的因素就取决于两军的士气了。,51,项羽这个粗人是深知这一点的,他在义军渡过河后令人击碎煮饭的大锅(破釜),还将渡河用的船只悉数尽沉河底
22、(沉舟),然后告诉义军士兵:“我们已没有退路了,只有不顾一切地猛击秦军,才有一线生路”。结果义军果真一鼓作气大败秦军,俘虏了秦军大将章钳。此战实际上为彻底推翻秦王朝打下了基础,从此义军一路顺风地打到了秦朝国都咸阳,52,用博弈论的语言来描述历史上的这一著名战役,我们说项羽的破釜沉舟就是一个“承诺行动”。对于义军士兵来说,其行动空间在项羽破釜沉舟之前可以说有四个元素: 即勇猛进攻,与秦军僵持不下,投降秦军,乘船返回逃跑。 如果两军相遇,义军选择“勇猛进攻”会冒很大风险,因为秦军太强大了;如果义军选择僵持不下,也不是个办法,因为拖延进攻时间对义军并无好处;如果义军选择投降,则按当时的情况无异于自取
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 博弈论基础 博弈论 基础 PPT 课件
链接地址:https://www.31doc.com/p-3531305.html