博弈论与企业策略.ppt
《博弈论与企业策略.ppt》由会员分享,可在线阅读,更多相关《博弈论与企业策略.ppt(51页珍藏版)》请在三一文库上搜索。
1、第十一章 博弈论与企业策略,一、博弈论概述 (一)博弈论的研究对象 博弈论Game Theory研究决策主体的行为发生直接相互作用时的决策,以及这种决策的均衡问题,即,当一个主体的选择受到其他主体选择的影响,而且反过来影响到其他主体选择时的决策问题和均衡问题。 (二)博弈论的发展历史 1944年,冯诺依曼Von Neumann和摩根斯坦Morgenstern合作的博弈论和经济行为The Theory of Games and Economic Behaviour 一书出版,提出了预期效用理论等概念,但与现代博弈论关系不大。,1950s,合作博弈发展到鼎盛时期,包括纳什Nash和夏普里Sharp
2、ley1953 年的“讨价还价模型”,Gillies和Sharpley1953年关于合作博弈中的“核”core的概念等。同时,非合作博弈也开始创立,纳什在1950年和1951年发表了两篇关于非合作博弈的重要文章,杜克于1950年定义了“囚犯困境”prisoners dilemma,从而基本上奠定了现代非合作博弈的基础。 1960s年代后,泽尔滕R.Selten把纳什均衡的概念引入了动态分析,提出了“精炼纳什均衡”的概念。海萨尼J.Harsanyi把不完全信息引入博弈论的研究。克瑞普斯Kreps和威尔逊Wilson 1982年合作发表了关于不完全信息动态博弈的重要论文。,专栏11-1:博弈论在微
3、观经济学中的重要性 1博弈论与新古典经济学 新古典经济学研究的是当外部条件既定时,单个厂商(消费者)的最大化决策问题,即在给定一个价格参数和成本(收入)的条件下,最大化其利润(效用),厂商利润(个人效用)函数只依赖于他自己的选择,而不依赖于其他人的选择;个人的最优选择只是价格和成本(收入)的函数,而不是其他人选择的函数。对单个人来说,其他人对其的影响都被总结在一个参数价格里,决策时,他既不考虑自己的选择对别人选择的影响,也不考虑别人选择对自己的影响。 但是,新古典经济学的分析有两个假定条件:一是市场参与者数量足够多,从而市场是竞争性的;二是双方不存在信息不对称的问题。第一个条件在现实中并不具备
4、,在市场参与者人数有限的情况下,即在不完全竞争市场上,人们之间的行为是直接影响的,所以,一个人在决策时,必 须考虑对方的反应,这就是博弈论研究的内容。同时,当信 息不对称时,非价格制度会出现,其显著特征是,参与人之 间行为的相互作用,因此,博弈论又成为分析非价格机制的 重要工具。 2博弈论与诺贝尔经济学奖 (1)博弈论与诺贝尔奖的授予 1994年诺贝尔经济学奖授予了三位博弈论专家:纳什、泽尔 滕和海萨尼。而1983年,英国wheatsheaf出版社出版的,由 当代在世的最著名的经济学术史专家Mark Blaug根据社会科 学文献引证索引编写的一本经济学家名人录中,收录了 从1970年到1981
5、年间在世的674位,去世的397位,共计 1071位经济学家的传记。在这本名人录中,没有纳什和泽尔 滕,只有海萨尼,但其名字下注着NE,即没有条款,原因是 他自己没有编写简历。而仅仅十几年后, 三人就获得了诺贝,尔经济学奖,说明了博弈论和经济学发展的迅速。 2005年度诺贝尔经济学奖则授予持有以色列和美国双重 国籍的罗伯特奥曼和美国公民托马斯谢林。瑞典皇家科学 院说,两位经济学家获奖是因为“他们通过对博弈论的分析 加深了我们对冲突与合作的理解”。这是自1994年之后,博 弈论学者再获诺贝尔经济学奖。谢林,执教于美国马里兰大 学经济学系,同时也是哈佛大学名誉教授。按照评委会的认 定,谢林的贡献,
6、在于显示“某一方可以显而易见地限制自 己的选择,以此强化自身的(竞争)地位;报复的能力可以 比之抵御攻击的能力更为有用;以及不确定的报复比之确定 的 报复更为可靠和更为有效。”评委会说,这些见解“已经证 明与化解冲突和努力避免战争有着相当大的关联”。奥曼执,教于耶路撒冷希伯来大学理性分析中心。奥曼和谢林之所以 一同获奖,是因为他们“以博弈论分析方式增进了我们对于 冲突与合作的理解。”具体到经济领域,他们帮助“解释了诸 如价格战和贸易战之类的经济冲突,以及为什么一些社区相 对于其他社区在管理共有资源方面更为成功。” (2)国外流行教科书中的博弈论 Hal Varian的微观经济分析Microec
7、onomic Analysis是一本在欧美非常流行的高级微观经济学教科书, 几乎所有大学的研究生课程都用这本书。在1984年的第二 版中,没有博弈论,甚至书后词汇表中也没有“博弈论”一词。 但在1992年第三版就加上了“博弈论”一章,而且有关寡头 竞争这一章也按博弈论理论重写了。,克瑞普斯David Kreps1990年出版的微观经济理论教程 A Course in Microeconomic Theory 是1991年最畅销的经济学教科书,被相当多欧美名牌大学选为研究生教材,其中第三部分就是“非合作博弈”,共219页,占全书的比重超过28%,其本人就是博弈论专家。1990年他因对博弈论的贡献
8、获得美国“克拉克奖”Clark Medel。 泰勒尔Jean Tirole1988年出版的产业组织理论一书,是目前最受欢迎的、最流行的产业组织理论教科书,全书的内容都建立在非合作博弈的基础上,以至于作者不得不在最后加上一章“非合作博弈论”,供不熟悉的读者参考。,相关链接111 从日常生活看“博弈论” “博弈论” 原本是数学的一个分支, 但由于它较好地解 决了对于竞争等问题的可操作性分析, 成为经济学中激荡 人心的一个研究领域。可以说, “博弈论”已经改变了经济 学的传统轮廓线。“博弈论” 的英语原文是game theory , 直译过来就是游戏论、运动论或竞赛论。譬如, 在足球比 赛中, 双方
9、都想在努力巩固防守的同时, 积极进攻以置对 方于“死地” , 这种行为就是一种博弈。“弈” 在汉语中是下 棋的意思, 下棋中的双方行为特征也如同足球比赛中双方 的行为。当然,扩展开来讲, 企业之间的竞争、国家之间 的角力等, 都是“游戏” , 只是游戏的内容不同而已。 我国古代有个“田忌赛马” 的故事, 说的是齐威王与大将田忌各出三匹马一对一比赛三场, 由于齐威王的最优、次优和较差的三匹马分别跑得比田忌的三匹马快,所以田忌总是以0:3告负。后来田忌的谋士孙膑给田忌出主意,让,最差的马去与齐威王最快的马比, 而让最优的马去赢齐威王次优的马, 让次优的马去赢齐威王最差的马, 这样便以2:1 取胜。
10、但我们还可进一步设想, 如果齐威王知道了田忌的花招后, 便会在以后的比赛中也更改出马的次序, 当然田忌的出马次序也应改动。双方的出马次序怎样才是最合理的呢? 这便是“博弈论” 更深层次研究的问题了。 2002 年度获奥斯卡大奖的影片枟美丽心灵枠中主角的原型, 便是“博弈论”中纳什均衡的创立者约翰 纳什。影片中有这样一个情节: 在美国普林斯顿大学的酒吧里, 个男生正商量着如何去追求一位漂亮女生, 当时还正在大学读书的纳什却在朦胧的“博弈论” 思维逻辑引导下喃喃自语: “如果他们 个人全部去追求那漂亮女生,那她一定会摆足架子,谁也不睬。然后再去追其他女孩子,别人也不会接受,因为没人愿意当次品 。但
11、如果他们先追其他女生,那么漂亮女生就会感到被孤立, 这时再追她就会容易得多。” 在纳什眼里, 追求女生就是一场“博弈” , 而“博弈” 是要遵循一定的规则的,是需要“博弈” 策略的。,我们再从经济决策上来看“博弈论” 。假如你是一个公司的老总,你在决定是否将自己的产品降价以及降价多少时,必须首先要考虑至少以下几个方面的问题:消费者将会增加购买吗? 大概会增加多少购买量呢? 其他同种产品的厂家也会降价吗? 等等。你只要是理性的话,一定会在对这些问题进行考虑的基础上来作出你的决策。所以说,“博弈论” 主要是研究各相关行为主体的决策行为相互影响、相互作用的假定条件下,理性的行为主体如何决策,以及这种
12、决策的均衡等问题的。在这里,决策均衡是一个经济学概念,意味着最佳决策或最佳决策的组合。因为只要决策是最佳的,相关的行为主体就不会去改变它, 从而使它处于稳定、均衡的状态。再简而言之,“博弈论” 就是分析博弈行为和博弈决策的一门科学。 资料来源:叶德磊:从日常生活看“博弈论” ,文汇报, 2005 年10月23 日。,(三)博弈的要素 构成博弈的要素主要包括参与人、行动、战略、支付、信息、均衡、结果等。 1.参与人players 一个博弈中的决策主体,其目的是通过选择战略(或 行动),以最大化自己的支付(效用)水平。 2.行动actions or moves 行动是参与人在博弈的某个时点的决策变
13、量。 1行动集合action set:可供某个参与人(i)选择的所有 行动的集合,写作Ai=ai。 2行动组合action profile:n个参与人的行动的有序集 a=(a1,ai,an)。 3行动顺序the order of play:根据行动顺序,可以将博 弈分为静态博弈和动态博弈。因此,行动顺序对于博弈 结果非常重要。,3.战略strategies 参与人在给定信息集的情况下的行动规则,它规定参与人在什么时候选择什么行动。 战略与行动是不同的概念,战略是行动的规则而不是行动本身,战略要说明什么时候采取什么行动。例如“人不犯我,我不犯人;人若犯我,我必犯人”,就是一个战略,而“犯”与“不
14、犯”是两种行动,这一战略规定了什么时候选择“犯”与“不犯”的行动。可以有的战略还包括:“人不犯我,我必犯人;人若犯我,我不犯人”;“人不犯我,我不犯人;人若犯我,我还不犯人”;“人不犯我,我必犯人;人不犯我,我还犯人”等。 在静态博弈时,战略与行动是相同的,因为作为参与人行动的规则,战略必须依赖于参与人获得其他参与人行动的信息,而在静态博弈中,双方同时行动,从而不可能获得对方行动的信息,因此战略选择就变成简单的行动选择。 战略必须是完备的。它要给出参与人在每一种可想象到的情况下的行动选择,即使参与人并不预期到这种情况会实际发生。,(1)战略集合strategy set:某参与人i所有可选择的战
15、略的 集合。Si=si。 (2)战略组合strategy profile:n个参与人每人选择一个战 略的n为向量。s=(s1,si,sn)。 4.支付pay off 在一个特定的战略组合下,参与人得到的确定的效用水 平,或者是指参与人得到的期望效用水平。 支付是博弈参与人真正感兴趣的东西。 博弈的一个基本特征是,一个参与人的支付不仅取决于 自己的战略选择,而且取决于所有其他参与人的战略选择。 5.信息information 参与人有关其他参与人的特征、战略、行动、支付等的知识 共同知识common knowledge:“所有参与人知道, 所有参与人知道所有参与人知道,所有参与人知道所有参与 人
16、知道所有参与人知道”的知识。,6.均衡equilibrium 所有参与人的最优战略的组合,记为s*=(s1*,si*,sn*)。 7.结果outcome 即博弈均衡产生的博弈的最终后果,包括均衡及其支付。 (五)博弈的分类 1.根据博弈参与人划分 (1)单人博弈。其实质是个体的最优化问题,即在一定条 件下选择最优战略。单人博弈区别于两人博弈和多人 博弈的根本之处在于,博弈的信息越多,支付越高。 (2)两人博弈。参与人为两人的博弈。 (3)多人博弈。三个或三个以上参与人的博弈。其与单人 博弈和两人博弈最大的区别在于,可能存在“破坏 者”,即具有下列特征的参与人:其策略选择对自身支 付没有任何影响
17、,但却会影响其他参与人的支付,有 时甚至是决定性的影响,如奥运会申办。,2.根据战略划分 (1)有限博弈(finite game)。一个博弈被称为有限博 弈,如果,第一参与人个数是有限的;第二,每个参与 人可选择的纯战略是有限的。它可以用矩阵式、扩展 式,甚至罗列方式表示。 (2)无限博弈(infinite game)。不符合上述两个条件的博 弈。一般用数集或函数式表示。 3.根据支付划分 (1)零和博弈。 无论各参与人如何决策,最后的社会总支付,即各参 与人支付之和总是为零。如猜谜游戏。一是各参与人之间的 利益是对立的,相互之间难以和平共处;二是各参与人为了 多得利益,总不希望对方知道自己选
18、择的战略,因此,这种 博弈的结果是不能完全确定的;三是即使进行重复多次的博 弈,也不会产生新的机会或可能。,(2)常和博弈。 各参与人支付之和总是等于一个非零常数。如分配固定 数额的奖金。各参与人之间的利益关系也是对立的,但较易 取得妥协,因而往往有一个确定的结果。在重复博弈中,由 于总支付增加,会创造出许多新结果。 (3)变和博弈。 在不同的战略组合下,各参与人支付之和是不同的。是 博弈的一般形式。 4.根据参与人行动次序划分 (1)静态博弈。 参与人同时进行战策选择、同时行动;虽然各参与人做 出决策的时间不一定真正一致,但至少在其作出各自选择前 都不知道其他参与人的战略选择;或在指导其他参
19、与人战略 选择后不能改变自己已经做出的选择。,(2)动态博弈。 各参与人先后、依次进行选择、行动,而且后选择、行动的参与人在自己选择前一般能看到此前其他参与人的选择、行动的博弈。参与人之间存在不对称性。后行为的参与人可根据先行动的参与人的行动作出针对性选择,而先行动的参与人在决策时,不但看不到后行动参与人的选择,而且还要考虑后行动参与人的反应。 (3)重复博弈。 同一博弈反复进行所构成的博弈过程。构成重复博弈的一次性博弈称为“原博弈”或“阶段博弈”,其一般是静态博弈。重复博弈的最少重复次数是两次。其中,到一定重复次数后肯定要结束的重复博弈称为“有限次重复博弈”。而无限次重复进行的博弈叫“无限次
20、重复博弈”。在重复博弈中,考察的重点不是某一次重复的结果或支付,而是原博弈重复进行后的总体效果或平均效果,因此,不能把重复博弈割裂为一次次独立的博弈进行分析,而是要将它们作为一个完整的过程和整体进行分析,因此,重复博弈是一种特殊的动态博弈。在重复博弈中,一次静态博弈中的均衡可能会发生变化。,5.根据参与人对其他参与人等的信息划分 (1)完全信息博弈(complete information)。 若各参与人都完全了解所有参与人的特征、战略、行动,以及在每种战略组合下的支付,并且不存在事前的不确定性,该博弈称为“完全信息博弈”。 (2)不完全信息博弈(incomplete information)
21、 至少存在部分参与人不完全了解其他参与人相关情况的博弈,称为“不完全信息博弈”。 6.根据参与人对博弈进程信息,对动态博弈进行划分 (1)动态博弈中,若某参与人行动时,对此前行动的各参与 人(包括“自然”)的选择、行动完全了解,称为“具有完美 信息的”参与人。若其不完全了解此前全部的博弈进程,称 为“具有不完美信息的”参与人。,(2)如果动态博弈中的所有参与人都是具有完美信息的,则 该动态博弈称为“完美信息动态博弈”,perfect information。 若动态博弈中存在具有不完美信息的参与人,该博弈称为“不 完美信息动态博弈”,(imperfect information)。 二、完全信
22、息静态博弈 (一)博弈的战略式表述(strategic form representation) 1.战略式表述又称为标准式表述normal form representation 在这种表述中,所有参与人同时选择自己的战略,所有参 与人选择的战略一起决定每个参与人的支付。需要注意得 是参与人“同时选择”的是战略,是参与人行动的全面计划 和准则,而不是行动。因此,战略式表述也可以用来描述 动态博弈。,2.战略式表述的组成及表示 (1)博弈的参与人集合:i; =(1,2,n) (2)每个参与人的战略空间:Si,i=1,2,n; (3)每个参与人的支付函数:ui(s1,si,sn),i=1,2,n
23、。 所以,G=S1,Sn;u1,un代表战略式表述博弈。 3.两人有限博弈的战略式表述的矩阵表述 例:囚犯困境prisoners dilemma,(二)占优战略均衡 1.占优战略(dominant strategy)是指无论其他参与人选择什么战略,该参与人的最优战略是唯一的,这样的最优战略被称为 “占优战略”。例如,在 “囚犯困境”中,“坦白”是囚犯A的占优战略,“坦白”也是囚犯B的占优战略。 2.占优战略均衡(dominant-strategy equilibrium)是指在一个博弈里,如果所有参与人都有占优战略存在,则所有参与人占优战略所组成的战略组合称为“占优战略均衡”。例如,在上例“囚
24、犯困境”中,(坦白,坦白)就是占优战略均衡。这时,个人理性与集体理性产生了冲突。需要注意得是占优战略均衡只要求每个参与人是理性的,不要求“每个参与人是理性的”是共同知识。,(三)重复剔除的占优均衡 1.例子:“智猪博弈” 在绝大多数博弈中,占优战略均衡是不存在的。在“智猪博弈”中,按下按钮可有8个单位食物,但要支付2单位成本。若大猪先到,大猪吃7个单位,小猪吃1个单位;小猪先到,各吃4个单位;同时到,大猪吃5个单位,小猪吃3个单位。 本例中,尽管 “等待”是小猪的占优战略,但大猪没有占优战略,因此,本博弈没有占优战略均衡。,2.重复剔除严格劣战略和重复剔除的占优均衡(iterated domi
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 博弈论 企业 策略
链接地址:https://www.31doc.com/p-5147877.html