《博弈论与经济模型》讲义第三章完全信息静态博弈.docx
《《博弈论与经济模型》讲义第三章完全信息静态博弈.docx》由会员分享,可在线阅读,更多相关《《博弈论与经济模型》讲义第三章完全信息静态博弈.docx(101页珍藏版)》请在三一文库上搜索。
1、第三章完全信息静态博弈正如我们在第二章中所指出的那样,局中人在博弈中所享有的信息量对于博弈的结果有着重大的影响,博弈中的信息对称程度(或不对称程度)也决定着博弈的特征和结果。除此之外,博弈中各局中人在选择其行动时的先后顺序也决定着博弈的特征和结果。譬如,有两个销售同样产品的销售商A和B打算进入某一区域性市场。由于这个区域市场对产品的需求是有限的,当他们都同时进入该区域市场时,他们各自占有的市场规模都偏小,从而造成1个单位的亏损;但是,当只有一个销售商进入该区域性市场时,则获得1个单位的利润;当然,不进入市场时的利润为零。假如A和B同时进行决策或者他们在进行各自的决策时并不知道另一方的选择,则博
2、弈就被称为是一种“静态”博弈,刻划它们的支付情况的矩阵被称为“支付矩阵”,见表3.1。表3.1市场进入的静态博弈B进入不进入-1,-11,00,10,0A和B的行动选择范围都是“进入”或“不进入”。当B选择“进入”时,A的最优行动选择是“不进入”,而给定A选择“不进入”时,B的最优选择是“进入”。因此,不进入,进入是一个纳什均衡。类似地,进入,不进入也是另一个纳什均衡。图3.1市场进入的动态博弈:A先行动下面,我们将这个博弈作一种修改,假定博弈是“动态”的,即A和B在行动选择上有“先”与“后”的顺序。假定A先选择,B在A完成了其选择后再进行自己的行动选择,并且B在进行行动选择前知道A的选择结果
3、此时,我们用图3.1来表示这个博弈。在图3.1中,空心和实心的小圆点被称为决策结(decisionnodes),位于决策结旁边的字母代表在这个决策结处进行行动选择的局中人,该局中人在此决策结处进行行动选择。通常,整个博弈中进行第一个行动选择的决策结用空心圆点表示。图中的线段被称为“枝”(branches),一个枝表示位于该枝上端决策结处的局中人在该决策结可能选择的一个“行动”。最下方的枝的下端被称为终点结(terminalnodes),当博弈进行到任一终点结时,博弈过程就告结束。终点结处的向量表示博弈进行到此处从而结束博弈时局中人的支付,向量中从左端数起第一个数字是最先行动的局中人的支付,第
4、二个数是第二行动的局中人的支付等等。每一个枝旁边的文字指出了该枝代表的行动。博弈的行动顺序在图中是从“上”到“下”,现在,我们来看看这个博弈的“均衡”是什么。当A选“进入”时,B接着就会选“不进入”;当A选“不进入”时,B接着选的是“进入”。A比较两种选择所获得支付,从而选择“进入”。于是,博弈只有一个“均衡”,即进入,不进入。均衡结果是:A选“进入”,B选“不进入”。图3.1中的几何图形常被称为“博弈树”。显然,行动有先后之分的“动态”博弈与“静态”博弈相比会给出不同的预测结果。下面,我们再将上述“动态”博弈中局中人A和B的行动顺序作一下修改,即假设B先行动,A在观察到了B的行动选择后,再进
5、行自己的行动选择。我们用图3.2来表示这个博弈。图3.2市场进入的动态博弈:B先行动显而易见,图3.2与图3.1所表达的博弈相比除行动的先后顺序不同外,其他结构特征完全相同。所以,均衡结果是:A选“不进入”,B选“进入。这样,我们看到,博弈的行动顺序会影响博弈的预测结果。我们通常将支付矩阵(或代数形式)表达博弈的方式称为博弈的“战略式”表述(strategicformrepresentation)或标准式表述(normalformrepresentation),而将用图3.1和图3.2中那种“博弈树”表达博弈的方式称为博弈的“扩展式”表述(extensiveformrepresentation
6、)0两种表述方法本质上是相同的,但通常用战略式表述表达静态博弈较为方便,而动态博弈用“扩展式表述”更为直观一些。譬如,我们用表3.2中的战略式表述来表示由图3.1给出的动态博弈。-1,-1-1,-11,01,00,10,00,10,0表3.2用战略式表述表示图3.1中的动态博弈B(进入,进入进入,不进入不进入,进入不进入,不进入进入不进入此时,需要注意的是,这时B的每一个选择或战略都必须给出任何情况下(无论其是否真正可能出现)自己的行动选择。在表3.2中,B有4种选择或战略,每一个战略用一个向量表示,向量中左端第一个行动选择对应于A选“进入”时B的行动选择,第二个行动选择对应于A选“不进入”时
7、B的行动选择。给定A选“进入”,B的最优选择是不进入,进入和不进入,不进入。当B选不进入,进入时,A的最优选择是“进入”,当B选不进入,不进入时,A的最优选择是“进入”;当A选“不进入”时,B的最优选择是进入,进入和不进入,进入;当B选进入,进入时,A的最优选择是“不进入”;当B选不进入,进入时,A的最优选择是“进入”。所以,有三个纳什均衡:进入,(不进入,进入),进入,(不进入,不进入)和不进入,(进入,进入),均衡的结果为:A进入,B不进入和A不进入,B进入。“均衡结果”指A和B的均衡战略组合下的预测的A和B的行动组合,“均衡”指均衡战略的组合,两者是不同的概念。显然,在这里,多个不同均衡
8、可以带来相同的均衡结果。细心的读者会发现:表3.2中用战略式表述的纳什均衡比图3.1中用扩展式表述的均衡多出一个,即不进入,(进入,进入),其均衡结果为A不进入,B进入。这个均衡实际上是不可信的,因为B威胁无论A是否进入他都要进入,若A相信B的威胁,给定B无论如何要进入,A的最优选择当然就是不进入。但是,A怎么能相信B的威胁呢?因为,只要A选择了“进入”,B的最优选择就是“不进入”而不是“进入”。所以,在我们对局中人的理性行为假定下(而这正是博弈论的假定前提),应该预测A会选“进入”而B选“不进入”。所以,这个多出来的均衡应去掉。显然,当用战略式表述表达动态博弈时,可能将一些不可信的均衡包括进
9、来,所以在动态博弈分析中常用的表述方式是扩展式而不是战略式表述。在这里,不可信的均衡中含有B对A的不可置信的威胁,应该从预测的均衡中去掉。我们将在第五章中对这个问题展开详细的讨论,并给出在较为一般的情况下去除这类甚至包括其他不可信均衡的方法,而剩下的均衡被称为“子博弈精炼纳什均衡“(sub-gamePerfectNashequilibrium)o类似地,也可用扩展式表述去表达静态博弈,两种表述方式是等价的。我们在本章将专注于介绍局中人同时作出决策或者局中人在进行决策时不能观察到其他局中人的决策且不存在信息不对称的博弈模型,这类模型表示的博弈被称为“完全信息静态博弈”(perfectinform
10、ationstaticgame)3.1 博弈模型的战略式表述战略式表述的博弈模型需要在以下几个要素内容方面作出明确的确定,即局中人(player)也称为参与人,指参与博弈的成员,可以是作为自然人的个人,也可以是企业、团体、组织机构、国家甚至国际联盟组织等。博弈论假定局中人是追求效用最大化的理性人。当局中人是企业、团体、组织机构甚至国家时,假定构成这类组织的自然人也是追求效用最大化的理性人。在具体的分析中,可以用利润最大化或其他目标函数来代替效用最大化,但这些不同的目标函数之间并不存在矛盾,它们都应被理解以效用最大化为一致性基础的相互可替代的表达方式。记n为一个博弈中局中人的个数(n=l,2,A
11、),T为所有局中人构成的集合,T二(1,2,A,n),i为一个特定的局中人(i=l,2,A,n),iI;一个特别的局中人可能是“自然”,它是我们上述规定的例外,因为它既不是自然人也不是由自然人构成的组织,同时也不是追求效用最大化的行为主体,它往往表示一种博弈面临的环境或外生条件。战略空间(strategyspace)每一个局中人可以选择的战略所构成的集合。一个战略(Strategy)是指局中人选择行动的规则,而行动是指局中人的决策变量。一个战略告诉局中人在什么时候选择什么行动。譬如,毛泽东在制订中国与其他国家之间的军事战略时就通过十六个字简明扼要地概括出其主要思想:“人不犯我,我不犯人,人若犯
12、我,我必犯人”。在这个战略中,“犯”与“不犯”是两种不同的行动,该战略规定了什么时候选择“犯”,什么时候选择“不犯”。记第i个局中人的战略空间为S;记S,中的一个元素为s,eS,iT;信息一一指局中人在博弈中拥有的相关知识,特别是有关其他局中人的特征和行动的知识。支付函数一一指局中人从博弈中获得的效用水平或利润水平或其他形式的目标函数。根据我们在前面给出的说明,无论是什么样形式的支付函数,它们一般都是以效用函数作为其基础的。结果一一这是一个内容较为广泛的概念,通常指研究者对博弈结束时所带来的各种感兴趣的效应或要素的集合,记第i个局中人的支付函数为u,=u,(s,A,s,A,S4),iT,局中人
13、的支付不仅是该局中人自己所选战略的函数,而且还是所有其他局中人选择的战略的函数,这正是博弈论所强调的互动效应的数学描述。均衡所有局中人都选择的最优战略或行动的组合。在博弈论中,有不同的均衡概念,但基础性的均衡概念指的是“纳什均衡”。我们一般将局中人、行动、结果统称为博弈规则,一个具体的博弈规则将决定相应的博弈均衡(但均衡不一定是唯一的)。我们将一个博弈记为G=S,A,S,;u1,A,称这种表述方法为一个博弈的“战略式表述“(strategicformrepresentation)o我们在研究中经常会遇到一类较为简单的博弈,称为有限博弈,其定义如下:定义3.1当局中人的个数n为有限数且每个局中人
14、的战略空间中的元素只有限个时,称博弈为有限博弈(finitegame)o显然,我们在第二章中给出的“囚徒困境”博弈,“市场进入”博弈等都是有限博弈。3.2 纳什均衡在博弈论发展史上,均衡的概念有着一段发展演化的经历。从早期的占优战略均衡、重复剔除劣战略的占优战略均衡,直到后来的纳什均衡,博弈论的基本框架才告完成。继纳什之后,一些更为精致的均衡概念也被陆续提出,而且,这方面的研究还在不断深入。但是,纳什均衡概念无疑在博弈论发展史上占据有里程碑式的地位,它的提出标志着博弈论进入了一个有着完整方法论体系的新兴学科的迅猛发展时期。在介绍纳什均衡概念以前,我们先来回顾一下有关占优战略均衡和重复剔除劣战略
15、的占优战略均衡的相关概念和理论。3.2.1 占优战略均衡所谓占优战略均衡,是指当所有局中人都选择各自的占优战略时所出现的战略组合。为了表达上的简略,我们今后可将除第i个局中人所选择战略s,S,之外的其他所有局中人所选择的战略组合向量记为s_=(s;,A,S-,SA,S4),s,S,iT,又记s=(si,As-,s;,SA,S4)=(ss_)o定义3.2设s,S7S,若满足I4,(jl,5JW.(s,X3巾,I)其中DM表示SA,SSS,构成的欧几里德乘积空间。则称X为。的劣战略,称s,为s,的占优战略。当不等式(3.1)对某些S变成等式时,称s,为&的弱劣战略,称s,轴;的弱占如战略)VL11
16、5当木嚏式(3.1)对任何s_,都是严格不等式时,即不等式2)成立。(3.2)则称S;为S;的严格或强劣战略,称S,为S,的严格或弱占优战略。显然,S;为&的占优战略就是在无论其他局中人选择什么战略情形下,局中人i选S;都是相对于他选S,为最优的战略。譬如,在前述给出的“囚徒困境”模型中,对于任一犯罪嫌疑人,无论另一犯罪嫌疑人是选择“坦白”或是选择“抵赖”,他选择“坦白”都是相对于选“抵赖”为最优的战略。因此,“坦白”是“抵赖”的占优战略,而“抵赖”是“坦白”的劣战略,并且,“坦白”还是“抵赖”的强占优战略,“抵赖”是“坦白”的强劣战略。定义3.3卷;是所有S,中其他战快的占优战略,则极为局中
17、人i的占优战略,其中s,sS,ieF0即是说当且仅当WSFT)满足不等式3)时,s;是i的占优战略。U,(s,s2)0,(s,sJ(3.3)j,eS1.s.le11SijeF当不等式(3.3)在某些S处变为等式时,称s,为i的弱占优战略;当不等式(3.3)对任何Je口3都是严格不等式时,称s,为严格或强占优战略。但是,在博弈论中,我们通常所说的(弱)劣战略并不是指(弱)劣于任何其他战略的战略,只要某个战略(弱)劣于另一战略,我们就可称其为(弱)劣战略。对于某局中人来说,假如存在某个强占优战略可选择,那么,我们就没有理由相信他会不选择这个战略。如果所有局中人都选择了各自的强占优战略。那么,我们可
18、预测没有任何人可能改变已有的战略选择。从另一方面看,如果在一个博弈中,每一个局中人都存在一个强占优战略(显然,此时这种强占优战略必然是唯一的),我们可预测每一个局中人都会选择其各自的强占优战略。所以,我们就自然将这种可能出现的均衡状态当作一种可预测结果。于是,我们有如下定义:定义3.4当一个博弈中的所有局中人都选择各自的强占优战略时,我们称博弈达到了占优战略均衡。当所有局中人都选择了各自的强占优战略时,根据理性人假定,我们可预测任何一个局中人都不会改变其己有的战略选择,因而这种已有的战略组合是一种均衡。需要指出,当我们把定义3.4中的“强占优战略”改为“占优战略”时,也会得到一种类似的均衡概念
19、在一些教科书中(譬如,张维迎1996,P59),也将这种均衡称为“占优战略均衡”。但是,对于弱占优战略,我们不能预测局中人一定会选择它,因为还至少存在另一种可选择的战略,它给局中人带来的支付在其他局中人选择某些特定的战略组合时与该战略带来的支付相等。这样,我们不能预测博弈的最终战略组合选择是什么。或者说,在这种场合,可能出现的博弈结局有多种可能,因而存在多个不同的“占优战略均衡”。为了避免这种不确定性,博弈论中通常将“占优战略均衡”按定义3.4的方式给出其定义,即只考虑由强占优战略组合构成的“占优战略均衡”。我们在本书中也沿此惯例,在谈到“占优战略均衡”时,指的是按定义3.4给出的概念。例3
20、1当我们在定义3.4中用“占优战略”取代“强占优战略”时,就可能存在多个“占优战略均衡”。表3.3中给出了一个例子。表3.3存在四个“占优战略均衡”的博弈BMR1,12,03,10,21,12,21,32,23,3当在定义3.4中用“占优战略”取代“强占优战略”时,A有两个占优战略,即战略a和战略c;B也有两个占优战略,即战略L和战略R;但a、C只是A的弱占优战略;L、R只是B的弱占优战略。显然,(c,L)、(c,R)、(a,L)和(a,R)都是在这种意义下的“占优战略均衡”。我们在前章中给出的“囚徒困境”博弈就存在“占优战略均衡”,由于该博弈中每个局中人都有强占优战略“坦白”,所以,该博弈
21、存在唯一的“占优战略均衡”即(坦白,坦白)。3.2.2 重复剔除严格劣战略的占优战略均衡尽管严格占优战略均衡或许是博弈模型能给出的一种很好的博弈结局预测,但存在严格占优战略均衡的博弈模型并不多见(存在占优战略均衡的博弈模型也很少),也就是说,运用严格占优战略均衡(甚至占优战略均衡)对博弈行为进行预测是不具普遍功用的,因为在许多博弈中,并不存在严格占优战略均衡(甚至占优战略均衡)。然而,严格占优的概念对于寻找许多博弈模型的均衡解仍然具有启发性。如果我们将对“严格占优战略”的要求放松至“相对严格占优战略”,即不要求某战略比其他所有战略都严格为优,仅要求某战略只比另一战略严格为优,此时,我们有理由预
22、测局中人不会选择另一战略(即劣战略),从而将其从博弈模型中剔除并得到一个新的博弈模型。假设其他局中人知道该局中人剔除了另一战略,而该局中人也知道其他局中人知道该局中人剔除了另一战略,博弈就在一个新的战略空间组合条件下进行。这种过程可以重复性地不断进行,因为剔除了某个劣战略的新博弈模型仍然可能含有新的属于其他局中人的劣战略,从而循着同样的方法将其剔除。当这种重复剔除劣战略的过程进行到最后时,倘若博弈模型只剩下唯一的一个战略组合,那么,可以预言这个战略组合是一种均衡,我们称其为“重复剔除劣战略的严格占优战略均衡”(iterateddominanceequilibrium),简称为“重复剔除的占优战
23、略均衡”。定义3.5战略组合s4=(S,A,S4)称为重复剔除劣战略的严格占优战略均衡,如果它是重复剔除严格劣战略后剩下的唯一的战略组合。当这种唯的战略组合存在时,我们称该博弈是重复剔除占优可解的(dominancesolvable)。例3.2智猪博弈在一个猪圈里养着一头大猪和一头小猪,在猪圈的一端放有一个猪食槽,在另一端安装有一个按钮,它控制着猪食的供应量。假定:按一下按钮,就有8单位猪食进槽,但按动按钮需支出2单位成本;若大猪先到食槽,则大猪吃到7单位食物,而小猪仅能吃到1单位食物;若小猪先到,则大猪和小猪各吃到4单位食物;若两猪同时到,则大猪吃到5单位,小猪仅吃到3单位。这里,每头猪都有
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 博弈论与经济模型 博弈论 经济 模型 讲义 第三 完全 信息 静态 博弈
