动态博弈、威胁与承诺(博弈论入门学习笔记四)

时间:2024-04-12 07:02:06

0 动态博弈

动态博弈:行动有先后顺序,不同的参与人在不同时点行动,先行动者的选择影响后行动者的选择空间,后行动者可以观察到先行动者做了什么选择。例如下棋、消费者和商家讨价还价、谈婚论嫁、企业之间的价格战等等。

因此,为了做出最优的行动选择,每个参与人都应该思考:如果我如此选择,对方将如何应对?如果我是他,我将会如何行动?给定他的应对,什么是我的最优选择?

动态博弈中的战略:在博弈开始之前就规定出每一个决策点熵的选择,即使这个决策点实际上不会出现。

考虑老师与学生之间考试之后的一个博弈:老师先行动(判分),学生后行动(在不同分数下如何应对)。假定学生的实际成绩是不及格。

动态博弈、威胁与承诺(博弈论入门学习笔记四)

动态博弈、威胁与承诺(博弈论入门学习笔记四)

这个博弈共有三个纳什均衡:(及格;A,F),(不及格;F,A),(不及格;A,A),学生“报复(F)”的威胁是不可信的:无论老师判“及格”还是“不及格”,“报复”不是学生的最优选择;

事前和事后:一种战略所规定的行动在事前看来是最优的,但事后看并不是当事人的最优选择,这种行动就不可置信,该战略就不是一个合理的战略。

1 序贯理性

序贯理性:在一个动态博弈中,参与人如果是理性的,他应该往前看,即不管事前制定的计划如何,他在新的时点上做决策都应该根据当前的情形选择最优行动。

序贯理性要求参与人在一个接一个的决策点上都要选择最优行动。这和静态博弈中仅要求参与人在事前一次性选择最优行动相比,要求就更高了。如果一个参与人总是序贯理性的,那么他所使用的战略将是由他在每一个时点上的最优行动组成的。换句话说,该战略将不仅是事前最优的,也会是事后最优的,将满足动态一致性的要求,从而不会包含不可置信的威胁。

精炼纳什均衡(也被称为序贯均衡):我们把所有不包含不可置信的行动的战略组成的纳什均衡称为精炼纳什均衡。精炼纳什均衡要求博弈的参与人必须是序贯理性的;在原博弈是一个纳什均衡;在每一个子博弈上都是纳什均衡。

那么怎样求解精炼纳什均衡呢?

逆向归纳法:从最后一个决策点开始找出该子博弈的纳什均衡;然后再倒回到倒数第二个决策点,找出决策者的最优决策;如此一直到初始决策点所有子博弈上的最优选择就是精炼纳什均衡。

逆向归纳的合理性在于我们假定参与人满足博弈论入门笔记二讲的理性共识的要求,即每个人都是理性的,而且每个人都知道其他人是理性的。

均衡路径:精炼纳什均衡在博弈树上所经过的决策点和最优选择构成一个路径,称为均衡路径。均衡路径的构成依赖于参与人在非均衡路径上的选择。

精炼纳什均衡战略不仅在均衡路径上是最优的,而且在非均衡路径上也是最优的。也就是说,参与人在不可能事件发生时,也应该按照理性的原则选择最优行动。这就出现了一个悖论:

反事实悖论:最优战略是基于理性假设做出的,但满足理性假设意味着不可能事件不会发生,如果不可能事件发生了,说明理性假设不成立,在采取下一步的行动时为什么还要假定对方是理性的呢?

反事实悖论是博弈论至今没有解决的难题。泽尔腾的“颤抖手均衡”理论将不可能事件的出现解释为理性的参与人不经意间犯的一个错误(Selten,1975),试图解决这一难题,但并不能完全让人信服。

3 承诺

承诺:在博弈论中,如果某个参与人采取某种行动,使得一个原来事后不可置信的威胁变成一个事后可以置信的威胁,事前最优和事后最优相一致,则这种行动被称为承诺

“许诺”和“威胁”都可以看成一种言辞上的表示;而“承诺”指的是一种行动,言而有信。这表明承诺比许诺重要,只有通过承诺,才能使得原本不能实现的帕累托最优成为均衡结果。

让承诺能够发挥作用的关键是承诺需要花费成本。承诺行动的实质是限制自己的选择范围,即放弃某些选择,或使得如果不选择许诺行为而是选择其他行为的话,就要付出更高的代价。比如“信用保证金”,“置之死地而后生”,“破釜沉舟”等等。

“反承诺”策略:通过限制己方的选择可以让己方的许诺或威胁变得可信。同样,增加对方的选择也可以让对方的许诺和威胁变得不可信。这就是“反承诺”策略。

比如《孙子兵法》第七篇“军争篇”中提到“围师必阙,穷寇勿迫”的说法,前者说的是包围敌军时,并不是要四面围住,而是围三面放一面,这样敌军就会从未包围的城门逃跑,己方可以轻松占领城池。后者是说,对于没有战斗能力、限于绝境的敌人不要过于逼迫他,否则有可能让其“狗急跳墙”、“鱼死网破”。这两句话的共同含义都是通过给敌人提供更多的选择而消磨对方的抵抗意志,让对方无法进行血战到底的承诺。

现代战争中“缴枪不杀”、“优待俘虏”的政策也是起到相似的作用。生活中,“得饶人处且饶人”也是这一“反承诺”策略的体现。

最惠条款:生产耐用品的企业经常被“降价预期”所困扰:如果消费者预期企业将降价,他们将会等待,结果,企业只能降价。如汽车行业面临的问题。最惠条款可以起到承诺的作用:企业不会降价了。

大学改革博弈:“不升即走”是学校的一个承诺:不会亏待优秀人才。在“不升即走”制度下,如果学校对教员不公正,优秀教员也有更高的市场价码,优秀人才流失以后,真正损失的是学校,学校就不敢对教员不公正,也就是说,正因为“不升即走”,学校就必须公正。

动态博弈、威胁与承诺(博弈论入门学习笔记四)

画家和*的苦恼

名画的价值取决于数量,画家常常为无法承诺而苦恼:谁相信他不会再画呢?这可能是为什么画家死了之后他的画变值钱。

*也有类似的问题。*经常缺乏承诺:给定投资者进入的情况下,多征税是最优的;但投资者预期到这一点,将不愿意进入。

作为承诺的法律

法律改变事后的选择空间或选择成本,所以可以起到承诺的作用;

合同的承诺作用(违约的成本增加,使得遵守合同更可能是事后最优的选择);

“法治”是*的承诺。

4 宪政与*

有限*:老百姓与*之间的博弈

市场要求有限*:*不仅要保护个人的基本权利不受其他人的侵犯,而且要把尊重这些权利作为对*行为的限制。如果*的*裁量权过大,*官员为所欲为,*本身会收到损害。

主权债务博弈:*首先决定是否发行公债以及发行多少,老百姓决定是否购买;债务到期时,*决定赖账还是偿还;如果*赖账,老百姓决定如何惩罚*。一般来说,*只有在预期赖账后受到的惩罚不小于偿还的情况下,才愿意购买公债。

宪政和法治可以理解为*对老百姓做出的承诺:*依法行事,接受老百姓的监督;*要保护个人的基本权利不受其他人的侵犯,而且要把尊重这些权利作为对*行为的限制。在宪政*下,*更受到老百姓的信任,所以*的力量反倒更强大。

法律有民法和刑法之分。刑法作为一种承诺,对潜在的犯罪行为具有更大威慑力。

如同宪政一样,*也可以理解为一种承诺。*制度倾向于照顾普通大众的利益,而非*制度更倾向于维护少数特权阶层的利益。在非*制度下,“为人民服务”是一个不可信的许诺。只有在*制度下,“为人民服务”才可能是一个可信的承诺。

社会动乱的威胁是英国建立*制度的主要驱动力。也正因为如此,英国的*化是一个渐进的过程,每一次的让步只是满足当时的“威胁者”的要求——如1832年的时候,只要“买通”中产阶级就可以换得和平,所以投票权只扩大到中产阶级;待新的威胁者出现后,再做出进一步的让步,直到全面普选权的实现。

当然,并不是所有非*社会的*都像英国*那样识时务并能与时俱进。有些非*社会的*习惯于用武力镇压的方式应对老百姓的*化要求,或者一开始得过且过,敷衍了事,最后实在没有办法时,才开始改革(如清朝*),但往往为时已晚,等待他们的只能是革命。