《2扩展式博弈与标准式博弈.ppt》由会员分享,可在线阅读,更多相关《2扩展式博弈与标准式博弈.ppt(29页珍藏版)》请在三一文库上搜索。
1、2 扩展式博弈与标准式博弈,2-0 如何描述博弈,要分析博弈问题,首先要找到便于进行博弈分析的表达方式 标准式和扩展式是描述博弈的两种方式: 支付矩阵(Payoff Matrix)(主要用于二人博弈) 博弈树(game tree),2-1 标准式博弈( normal form game ),标准式博弈的描述工具是支付矩阵(payoff matrix) 参与人多于两个时,这种描述便产生困难(见下图),支付矩阵的一个简单例子,每参与人存在有限个更多的战略,思考:若每人有无限个战略如何描述?,例如:在“西班牙叛乱”例子中,叛军可以往任何一个方向出击。 尽管此例中以这样的战略描述叛军有点可笑,但如果将
2、叛军的处境想像为四面受敌而准备突围,这样的战略描述就是贴近现实的。,同时行动博弈的基本思维方式,我认为他认为我认为 诸葛亮:认为曹操见到小路上的烟火会认为是自己实行的“实则虚之”的战略,故在小路放火、小路伏兵 曹操:认为小路烟火是诸葛亮“实则虚之”的战略,故走小路 却不知道:诸葛亮知道自己知道“实则虚之”的用兵之道,2-2 扩展式博弈,扩展式博弈(extensive form game): 描述工具是博弈树,扩展式博弈中的战略,战略是行动计划,具体到扩展式博弈中,这是由每个参与人在它的每个行动结点上对应的行动方案的组合。 例如:在最后通牒博弈中,A只有一个行动结点,所以A的战略为给B90;给B
3、10;B有两个行动结点,每个行动结点都是接受或拒绝,于是B的战略为:,(给90接受,给10接受),(给90拒绝,给10接受),(给90接受,给10拒绝),(给90拒绝,给10拒绝),博弈树结构,结点(node):表明由谁行动 分枝(branch):表明参与人可选择的行动 收益(payoff):在最后的结点上,做为博弈的结果,每种博弈的路径给参与人带来的收益,博弈树结构:分钱博弈,结点,分枝,结点,扩展式博弈的基本思维方式,向前展望,向后推理 向前展望:如果我给他留90,他会怎么做? 向后推理:如果他拒绝(接受),我该给他留多少?,2-3 两种形式的转换,描述扩展式博弈的博弈树与描述标准式博弈的
4、支付矩阵可以相互转换。,(1)标准式博弈转换为扩展式博弈,信息集:当参与人轮到自己行动时所了解的信息 在同时行动的博弈中,即使用扩展式博弈来描述,甲、乙的行动也是不分先后的 在上例中,可将乙放在甲的位置上,则甲的两个结点属于同一信息集,信息集的特点,如果两个结点同属一个信息集,意味着参与人在两个(或两个以上)结点处知道相同的信息,因此,参与人在这两个(或两个以上)结点必然有同样的行动集。,(2)标准式博弈转换为扩展式博弈,相机战略,这种表达意味着A、B同时行动 正确的表达应该使用每个人的战略(而不是行动) 这里的战略是相机战略 相机战略: 仅在不确定性事件发生时才会采取的战略,只有对方实施了某
5、种战略时,相机战略才会生效 计划里“如果”这一假设条件成为现实时,该相机战略才会被执行 如果将战略视为相机战略, 则所有的博弈都可以用标准式博弈(22博弈)的支付矩阵表示,分钱博弈中A、B的相机战略,A:无论B接受还是拒绝,给10; 无论B接受还是拒绝,给90 B: 若给10接受, 若给90接受; 战略1 若给10接受, 若给90拒绝; 战略2 若给10拒绝, 若给90接受; 战略3 若给10拒绝, 若给90拒绝 战略4,扩展式博弈与标准式博弈在描述的相互转换(2),2-4 联盟博弈,吴、蜀之间存在利益冲突,并多次兵戎相见,但两国为什么在赤壁之战中能结为联盟? 联盟:相互协调行动的一组博弈参与
6、人 联盟价值:一个联盟的产出(收益),2-4 几种著名的博弈例子,囚徒困境 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: (1)若一人认罪并作证检控对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 (2)若二人都保持沉默(相关术语称互相“合作”),则二人同样判监1年。 (3)若二人都互相检举(相关术语称互相“背叛”),则二人同样判监8年。 性别战 懦夫博弈(斗鸡博弈) 鹰鸽博弈 智猪博弈 假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮
7、会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,若大猪先到槽边,大小猪吃到食物的收益比是91;同时到槽边,收益比是73;小猪先到槽边,收益比是64。那么,在两头猪都有智慧的前提下,最终结果是小猪选择等待。 猜硬币游戏/包袱剪子锤 最后通牒博弈,小结,博弈有两种形式:标准式(也称战略式)和扩展式 标准式博弈描述的是同时行动(静态) 扩展式博弈描述的是序贯行动(动态) 标准式和扩展式可以相互转化 动态博弈中将行动描述为相机战略,也可以用标准式表示 标准式博弈使用信息集也可以用扩展式来表达 联盟博弈是合作博弈,练习与思考1:田忌赛马,故事情节 博弈描述 参与人 战略(用静态博弈方法) 结果与收益,博弈描述的复杂性 再谈田忌赛马,齐王,田忌,田忌,田忌,中,强,强,弱,弱,齐王,齐王,齐王,中,强,弱,中,强,弱,中,强,弱,田忌,田忌,强,弱,田忌,田忌,强,弱,田忌,田忌,中,弱,中,弱,强,弱,强,弱,强,中,强,中,
链接地址:https://www.31doc.com/p-3463854.html