章有限重复博弈.ppt
《章有限重复博弈.ppt》由会员分享,可在线阅读,更多相关《章有限重复博弈.ppt(52页珍藏版)》请在三一文库上搜索。
1、第11章 有限重复博弈,在每一个重复博弈中,有一个实施许多遍的组件博弈有时候称作阶段博弈。,博弈中的盈利是每个阶段的盈利之和,修改版囚徒困境,我们对标准的囚徒困境添入一个策略;除了c与n之外,每个局中人有第三个策略,设为p,表示“部分认罪”。考虑如下阶段博弈:,1,无限重复囚徒困境,假设在每一个阶段两个局中人参与囚徒困境。但是,没有固定的重复次数。他们每一次参与阶段博弈,存在概率 使相同的局中人再次参与阶段博弈。反过来,存在着概率1 使当前的相互作用成为最后一次相互作用。,这个博弈叫做无限重复囚徒困境;此术语归因于博弈没有固定终点这一事实。无限重复囚徒困境的盈利计算如下。假设在第t阶段,局中人
2、i得到盈利it。在实际中实施到第t阶段的可能性是 t。从而第t阶段的期望盈利是 tit。总期望盈利是这些阶段博弈期望盈利之和;即,等于 定义 重复博弈由阶段博弈G和它的重复次数(设为T)确定。阶段博弈G是策略型博弈: 其中Si是局中人i的策略集,i是他的盈利函数它依赖于(s1, s2, , sN)。,经济应用,短期国库券拍卖。 专利药品市场的竞争。 NASDAQ市场制作。 国际石油市场或OPEC。,有限重复博弈,T次重复囚徒困境的唯一子博弈完美均衡是,在每一突发事件中局中人认罪。 假如修改版囚徒困境进行T次。考虑如下策略对:从(n, n)开始,除了最后一次以外,在所有阶段继续取(n, n) 在
3、最后阶段,采取(p,p)。沿着所提供的这个程序,没有一个局中人会偏离它(并在首T个阶段中的任何一个阶段中采取非n的其他策略)。倘若发生了偏离,从随后的阶段起并一直下去都采取(c, c)。所述的策略是子博弈完美均衡。,命题 考虑有限重复博弈(G,T),其中G = Si, i; i = 1, 2, , N。假如阶段博弈G恰好只有一个纳什均衡,设为(s1*, s2*, , sN*)。那么重复博弈有唯一的子博弈完美均衡。在这个均衡中,不管局中人i或其他任何局中人,在任何一个以前的阶段中采取了什么样的行动,局中人i在T个阶段的每一个中都取si*。,案例分析:短期无息国库券拍卖,对某些有价证券,存在单价拍
4、卖。其间所有购买者支付同样价钱。对某些其它的有价证券,存在多重价格拍卖,其间不同的购买者支付不同的价格。现在我们要研究的问题如下:如果财政部希望极大化它的筹资数量,它应该采用两种拍卖形式中的哪一种?,简化假设。,第一,我们将假设在这次拍卖中有两家金融机构,或者局中人。 第二,财政部在一次又一次的拍卖中所出售的量保持不变;令这个量等于100。 第三,我们将假设每个购买者可以报两种价格和两个购买量;称为高(h)及低(l)和数量50及75。 第四,购买者只关心利润;每种有价证券的利润,如果价格为h,则表示为h,同样地如果价格是l 则利润表示为l。假定两种利润水平都是正的(当然,l h)。,如果每个购
5、买者都想以高价购买,那么在这个价格上的总需求至少是100并且所有国库券都以这个价格出售。同样,如果两个购买者都希望以低价购入,那么市场价格就低。但是,如果购买者之一想以h购买而另一个想以l购买,那么价格结局依赖于拍卖形式。在单价拍卖中,市场价格将为低,而在多重价格拍卖中,一个购买者将支付h而另一个支付l。在任何一种情况,高投标者得到他要求的所有数量,剩下的数量则分配给低投标者。最终,如果价格投标相同,那么数量以需求比例进行分配。例如,如果一个购买者想要75单元而另一个想得到50单元,那么前者得到现成的100单元中的60单元。,单价拍卖的策略型如下:,购买者1 50, h 75, h 50, l
6、 75, l 购买者2 50, h 50h , 50h 40h, 60h 50l, 50l 50l, 50l 75, h 60h , 40h 50h, 50h 75l, 25l 75l, 25l 50, l 50l, 50l 25l, 75l 50l, 50l 40l, 60l 75, l 50l, 50l 25l, 75l 60l, 40l 50l, 50l,多重价格拍卖的策略型,购买者2 50, h 75, h 50, l 75, l 购买者1 50, h 50h, 50h 40h, 60h 50h, 50l 50h, 50l 75, h 60h, 40h 50h, 50h 75h, 25
7、l 75h, 25l 50, l 50l, 50h 25l, 75h 50l, 50l 40l, 60l 75, l 50l, 50h 25l, 75h 60l, 40l 50 l, 50l,考察缩小了的单价拍卖:,购买者2 75, h 75, l 75, h 50h , 50h 75l , 25l 75, l 25l , 75l 50l , 50l 缩小了的多重价格拍卖: 购买者2 75, h 75, l 75, h 50h , 50h 75h , 25l 75, l 25l , 75h 50l , 50l,购买者1,购买者1,情况I:竞争的情况,假设,即使以低价格购买一半数量是无利可图的;
8、即,假如50h 25l。那么在缩小了的单价拍卖中h是优策略。因此阶段博弈中唯一的纳什均衡是(h, h)。财政部特别喜欢,因为在每一个阶段中的(h, h)也就成为唯一的子博弈完美。(为什么?)如财政部所作的那样,重复拍卖,使得在市场上竞争的剧烈程度不起作用并且不允许参与者为保持低价格而作确实有效的交易。 现在考虑缩小的多重价格拍卖。如果对于低价格的最优反应也是出低价,即,如果50l 75h,那么这次就可能有第二个纳什均衡了。在那种场合,(l, l)也是纳什均衡;即,购买者企图无保留地进行串通,使价格保持低位。因而一个子博弈完美均衡是双方购买者一直都出价l。,情况II:共谋串通情况,在多重价格拍卖
9、中,l是优策略(从而,购买者由于报低价而“亏待”财政部)。 在单价拍卖中,阶段博弈存在唯一的混合策略纳什均衡. 唯一的阶段博弈均衡策略也是唯一的子博弈完美均衡策略。因此,在多重价格拍卖中,(l, l)被重复地实施,而在单价拍卖中,l和h的对等混合(纳什均衡)重复地实施。因为在后者均衡中,财政部发现至少在某些时候为高价格,显然财政部觉得这样更可取。 总的来说,单价拍卖总是受到财政部的青睐。在竞争场合,它一直确保高价格,而在共谋串通情况,有些时候保证高价格。,第12章 无限重复博弈,折扣,局中人i的总折扣盈利 为 有关折扣总和的一个事实是非常有用的: 事实1:当每个阶段的阶段博弈盈利都等于1时,总
10、和1 + + 2+ + t + 等于 因此,当阶段博弈盈利为常数,比方,那么总和等于,触发策略和好行为,囚徒困境阶段博弈周而复始地进行,没有明确的最后阶段。 考虑如下策略对,每个局中人对应一个策略:由采用(n, n)开始。如果在任何阶段没有一个局中人认罪,那么继续采用(n, n)。但是,如果在某个阶段两个局中人中只要有一个认罪,那么从此以后每个阶段一直采用(c, c)。像这样的策略称为严厉的触发策略:对可取行动(n, n)的偏离,开启了“惩罚阶段”(c, c)。触发在下述意义下是严厉的,惩罚阶段一旦开始,决不撤消。,对于严厉触发策略,实际上只有两类子博弈(1)在首t个阶段重复采用(n, n)之
11、后的子博弈,和(2)其它的子博弈。 对于类型(2),策略明确说明从此以后都采用(c, c)。在这个子博弈里面,它的确是纳什均衡。没有一个局中人能在任何阶段通过取n来对付c从而增加自己的盈利;而且,他不会改变今后预期的行动方式。,对于类型(1)的子博弈,让我们检查一下局中人在任何阶段是否有认罪的动机而其他的局中人在那个阶段取的是n。做这样的事将给认罪的局中人带来眼前的盈利7,但在以后的每一个阶段结果盈利为0。(为什么?)继续采用这个策略将为这个局中人产生当前阶段的盈利5和未来每一个时期中一连串的盈利5。因而,继续采用这个策略的总盈利为 显然,只要 ,即,只要 大于 2/7 ,继续采用所提出的严厉
12、触发策略较好一些。,在无限重复博弈中“好”是可以持续的,因为在每一个阶段有可能做出有条件的好人承诺如果今天你“好”,那么明天我也“好”。(伴随的威胁是,如果今天你“恶”,那么此后我一直“恶”。)承诺保证了盈利5的持续不断;凶恶地威胁表明了从此以后盈利降为零。 如果一个局中人单方面决定今天当一回恶人,那么在他们中间,构成了将来损失5 /(1- )的盈利。如果很在乎未来,即,如果 大的话,这种“大棒胡萝卜”是十足的威慑。,严厉的触发策略由两个部分组成:第一,存在严厉的惩罚,永远地(c, c)下去。第二,存在可取的“好人”行为,永远地(n, n)。对可取行为的任何背离会触发惩罚。如果 足够地大,那么
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 有限 重复 博弈
链接地址:https://www.31doc.com/p-2806722.html