对策论基础NEW.ppt
《对策论基础NEW.ppt》由会员分享,可在线阅读,更多相关《对策论基础NEW.ppt(82页珍藏版)》请在三一文库上搜索。
1、第十四章 对策论基础,概论 基本概念与名词 对策分类 矩阵对策的基本理论 矩阵对策的数学模型 最优纯策略 混合策略与混合扩充,第十四章 对策论基础,竞争无处不在,体育比赛、军事斗争、商业谈判、市场争夺、职位竞聘。为了在竞争中谋取最大利益,必须采取对抗其他竞争者的策略,这就是对策问题。研究竞争场合下决策者采取对策的理论与方法,称为对策论,又称为博弈论。 我国古代就有著名的“齐王赛马”例子。,第一节 概论,基本概念与名词 对策分类,对策现象的三个基本要素,1.局中人: 在竞争中,拥有决策权的参与者,可以是个人,也可以是团体。桥牌,象棋; 2. 策略: 可供局中人选择对付其他局中人行动方案称为一个策
2、略。该方案必须是自始至终通盘筹划的行动方案。例子。“当头炮”不是一个策略,而是某一个策略的组成部分。 3.一局对策的得失: 一局对策结束后,对每个局中人来说,不外乎胜利和失败,或其它收入,这些统称为“得失”.,对策现象的三个基本要素,4.策略集: 一个局中人所拥有的策略全体。 5.局势: 各局中人使用一定的对策,从而形成了一种状态称为局势。 6.支付函数: 局中人不同的策略,会有不同的得失,故”得失”是策略组合的结果;即一局对策结束时,每个局中人的“得失”是全体局中人所取定的一组策略的函数,称为“支付函数”.,一、基本概念与名词,7.零和对策:如果在任一“局势”中,全体局中人的“得失”相加总是
3、等于0时,这个对策就称为零和对策。上述赛马就是零和对策。否则称为非零和对策 8.矩阵对策:参加对策的局中人只有二人,而每个局中人可选策略只有有限个,每局的得失之和为零.,二、对策分类,对 策,静 态 对 策,动 态 对 策,结 盟 对 策,不 结 盟 对 策,微分 对策,联合对策,合作对策,三、博弈论发展史,1944年,von Neumann and Oskar Morgenstern发表专著 The Theory of Games and Economic Behavior创立了博弈论 1950,1951年,纳什(Nash)和图克(Tucker) 奠定了非合作博弈论的基础 1965年,泽尔腾
4、(Selten)将动态分析引入纳什平衡,建立了精炼纳什平衡 1967,1968年,海萨尼(Harsanyi)将不完全信息引入博弈论,三、博弈论发展史,1982年,克瑞普斯(Kreps)和威尔逊(Wilson)发表了动态不完全信息博弈的重要文章,建立了动态不完全信息博弈的理论 上世纪八十年代开始,博弈论进入经济学,进而在管理学中得到了很好的应用;九十年代,经济学教科书中加入了博弈论 1994年,Nash, Selten & Harsanyi三人获得了诺贝尔经济学奖,博弈论的地位正式确立。恰逢Von Neumann and Morgenstern建立博弈论50周年。,三、博弈论发展史,1994-1
5、996年美国国会授权联邦通讯委员会(FCC)公开拍卖部分用于个人通讯服务(PCS)的无线电频段,FCC接受博弈论专家的设计,采用多回合的竞买者同时出价的增价模式,取得了巨大的成功。博弈论开始为企业界所接受并走向实用。 1999-2001年美国先后出版了小说美丽的心灵和拍成了电影美丽的心灵,并获奥斯卡奖。纳什和博弈论妇孺皆知。,第二节 矩阵对策的基本理论,矩阵对策的数学模型 最优纯策略 混合策略与混合扩充,一、矩阵对策的数学模型,以齐王赛马为例说明 齐王赛马二人非合作零和对策 局中人齐王和田忌 策略 上 中下三种等级的马的组合 ,比三次,有六组策略: ( 上,中,下) 、 ( 中,上,下) 、
6、( 上,下,中) 、 ( 中,下,上) 、 ( 下,上,中) 、 ( 下,中,上) 对齐王,这六组策略用 表示, 对田忌,则用 表示。,四、博弈论的典型例子,齐王赛马支付函数,(上中下) (上下中) (中上下) (中下上) (下中上) (下上中),田 忌,(上中下),(上下中),(中上下),(中下上),(下中上),(下上中),齐王,策略组合的得失:齐王赛马赢得矩阵A,(上中下) (上下中) 齐 (中上下) 王 (中下上) (下中上) (下上中),田 忌,(上中下) (上下中) 齐 (中上下) 王 (中下上) (下中上) (下上中),田 忌,当齐王从S1中选定一个策略ai,田忌从S2挑选一个策略
7、bj应对,那么双方就形成了一个局势(ai,bj),称为纯局势.ai,bj称为纯策略.,对策的数学表示,齐王,田忌赛马的模型可表示为: 其中I、II表示两个局中人,S1、S2分别表示局中人I、II的策略集,A则表示赢得矩阵:,2.最优纯策略,现有一矩阵对策 其中,从最坏处着想,去争取最好的结果-即最优纯策略。 对局中人甲来说,所有最坏的结果是(取A中每一行的最小) :得 -8,2,-10,-3,在这些最坏的情况中最好的结果是2,因此,无论局中人乙采取什么策略,局中甲只要选a2参加对策,就能保证收入不会小于2。 对局中人乙来说,所有最坏的结果是(取A中每一列的最大元素,损失最大): 9,2,6,
8、在这些最坏的情况中最好的结果是2,因此,无论局中人甲采取什么策略,局中乙只要选B2参加对策,就能保证损失(支出)不会大于2。 那么,此时,局中人甲和乙的最坏情况下的最好结果的绝对值相等(都是2),那么我们就称a2为局中人甲的最优策略,B2就称为局中人乙的最优策略。(a2,B2)就称为对策模型G=S1,S2,A的最优局势,而局中人甲的赢得值2称为对策G的值;,例: 甲乙乒乓球队进行团体对抗赛,每队由三名球员组成,双方都可排成三种不同的阵容,每一种阵容可以看成一种策略,双方各选一种策略参赛.比赛共三局,规定每局胜者得1分,输者得-1分.甲队的策略集为S1=a1,a2,a3;乙队的策略集S2=B1,
9、B2,B3 。根据以往比赛得分资料,可得甲队的赢得矩阵为A:,1 2 3,1 2 3,A=,试问这次比赛各队应采用哪种阵容上场最为稳妥?,上述描述可表示为:G=甲,乙;S1,S2;A ;G=S1,S2;A 题中所谓的稳妥,是指不求得分最多,期望失分最少; 由于A是甲队的赢得矩阵(得分矩阵),因此,甲队失分最少,意味着有最基本的得分底线(最少应得分). 甲队采用策略 1,可得分min=1,max=1 2,可得分min=-3,max=1 3,可得分min=-1,max=3 很显然,甲队有保底得分:max1,-3,-1=1 只要采用策略1即可实现.,1 2 3,1 2 3,A=,从乙队角度看,采用以
10、下策略的最少赢得(即A中最大): 1,失分3 ,1, 2,失分1 , -1, 3,失分3 , -3, 为稳妥起见,乙队应从失分中挑选最小的. 即采用策略2 ,无论甲队怎样布阵,乙队最多失1分. 总结上述可知,在上述对策中,甲队采用策略1,乙队采用策略2,可获取自己所需要的最底线.称(1,2)为局中人甲队,乙队的最优策略。,1 2 3,1 2 3,A=,在一个对策G中,局中双方要获得最优纯策略,必须满足一定的条件,,1 2 3,1 2 3,A=,得分方:正方,失分方:反方,例子1,B 1 2 3,1 2 3,3 1 3,1 -3 -1,Min3,1,3=1,Max:1,理智行为,各列最大(Max
11、):,A=,各行最小(Min),例子2,采购博弈二人非合作零和博弈 局中人采购员和气候 策略 气候:偏暖、正常、偏冷; 采购员购煤 : 10、 15、 20吨 支付函数秋天购买价格为10元/吨,冬天再购买价格是10元/吨(偏暖)、15元/吨(正常)、20元/吨(偏冷)吨。 假设不知天气预报,问:秋天应贮存多少吨煤能使单位的支出最少?,气候 偏暖 正常 偏冷,10 采购员 15 20,MAX:,MIN,Min: -200,MAX: -200,例子2,气候 偏暖 正常 偏冷,采 10 购 15 员 20,MAX:,MIN,Min: -200,MAX: -200,秋季采购,最优纯策略的表述,设对于矩
12、阵对策G:G=S1,S2,A等式 成立,记其值为VG ,则称VG 为对策G的值。如果纯局势 使 则称 为对策G的鞍点,也称为对策G的在纯策略中的解(矩阵对策的最优解), 分别是局中人I、II的最优纯策略。,练习: 1.设对策G=S1,S2,A,其中,A=,S1=a1,a2,a3,a4,S2=B1,B2,B3 求对策G的鞍点和对策值,及局中人的最优策略,VG=2,(a2,B2),MAXMIN=5,练习: 2.设对策=S1,S2,A,其中,A=,S1=a1,a2,S2=B1,B2 求局中人的最优策略和对策值,MAXMIN=0 MINMAX=1,不相等,无解,练习: 3.设对策=S1,S2,A,其中
13、,A=,S1=a1,a2,a3,a4,S2=B1,B2,B3,B4 求局中人的最优策略和对策值,VG=5, (a1,B2),(a3,B4) (a1,B4),(a3,B2) MAXMIN=5,定理1:矩阵对策G=S1,S2,A有纯策略解的充要条件是存在一个纯局势 使得,或赢得矩阵满足条件:,证明略.,3、混合策略与混合扩充,基本概念:当 时不存在最优纯策略,此时需要应用混合策略的方法确定参加对策的纯策略。 例如,分析上述例子,因为 所以 从 看,最优策略是甲选a2,乙选B2, 但从 看,甲应选a1,乙选B2 两个局人没有稳妥的策略,此时,这时就得估计选取各个策略可能性的大小来进行对策.即就是用多
14、大概率选取各个纯策略. 这样局中人不能单独地使用某一个策略,只好结合不同概率分布以使甲(乙)平均赢得(损失)最多(最少),为标准来选取策略,这种策略称之为混合策略.,分析上述例子,因为 所以 此时假设局中人I以概率x选取策略a1,以概率(1-x)选取策略a2;局中人II以概率y选取策略B1,以概率(1-y)选取策略B2。则对于局中人I来说,赢得的期望值为E(x,y),它等于,例子引出混合策略,赢得期望值 当X=1/2 在x=1/2,y=1/4时,赢得函数取得最优值5/2。这实际上是对策双方都满意的结果。我们把纯策略对应的概率向量叫做混合策略,最优解则是最优混合策略。本例中,最优混合策略是(1/
15、2,1/2)和(1/4,3/4)。,混合策略的定义,令纯策略集对应的概率向量是 它们满足 定义: 为局中人甲的赢得,-E(X,Y)为局中人乙的赢得.,混合策略的定义,局中人甲,乙的混合策略的集合为: 将 叫做G=S1,S2,A的混合扩充。,最优混合策略的定义,若令 并有 则称(X*,Y*)为最优混合局势,或叫做G在混合策略下的解,V叫做对策G的值。X*、Y*分别是局中人I、II的最优混合策略。,混合对策问题的解法,如果G的值是V,则局中人I和II的最优策略是下列两组不等式的解: 关于混合对策问题的解,我们有如下定理:,混合对策最优解定理,如果(X*,Y*)是对策G的最优混合局势,则对于某个i或
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 策论 基础 NEW
链接地址:https://www.31doc.com/p-2530193.html