《策略思维》由耶鲁大学和普林斯顿大学两位教授联合撰写的一本书,该书用许多活生生的例子,向没有经济学基础的读者展示了博弈论策略思维的道理。全书共13章,整体回答了几个方面的问题:
书的主旨是告诉我们在自己的工作和生活中如何使用策略思维。
以下是读完整本书,总结的逻辑结构图。
在分析为什么研究策略思维之前,我们可以先思考,什么是策略思维?它与博弈论有什么关系?
策略思维的科学称为博弈论(也就是两者本质是一回事)。我们耳熟能详的博弈论是囚徒困境,策略思维是关于了解对手打算如何战胜我们,然后我们采取相应的方法战而胜之的艺术。全书开篇用了一些生活的案例来说明为什么我们要研究策略思维,这也是我们比较关心的问题。
01我们为什么要研究策略思维
工作,即便只是社交生活,也可以看做是一个永无止息的决策过程。从事什么样的工作,怎样打理一宗生意,该和谁结婚,怎样将孩子抚养成人,要不要竞选总统,等等,这些都只不过是重大决策的几个例子。上述情况存在一个共同的条件,即你不是在一个毫无干扰的真空世界里做决定。相反,你的身边全是和你一样主动的决策制定者,他们的选择与你的选择相互作用。这种互动关系将对你的思维和行动产生重要的影响。
中国的跨地区移动通讯为什么要收取漫游费?要知道,全世界只有三个国家在收取漫游费——中国、印度和日本。为什么?运营商说跨地区移动通讯会增加运营商的业务量,所以成本的增加使得它们通过收取漫游费来填补额外的成本。其实,收取的漫游费数量远远超出了它们购买设备处理业务的费用,这样的理由是不成立的。那么,是什么难言之隐让运营商要收取漫游费呢?博弈论让我们很容易推演出运营商难言的秘密:如果取消漫游费,那么运营商们就处于全国统一的竞争性市场中,它们之间就会打起价格战,导致大多数运营商退出,而留下极少数幸存者垄断市场。并不是所有的运营商都有这样的自信:我会是最后的幸存者。所以它们之间就达成这样的默契:通过漫游费将市场分割为各个区域性市场。漫游费是地区市场分割的壁垒,各个地区的运营商都在自己的地盘里过着垄断带来的好日子。
比如,在漫游费的高墙下,你是北京的用户,想用重庆的电话,因为重庆的话费可能要便宜一些。但是,漫游费就让你用重庆的电话比用北京的电话还要贵。这样,即使重庆的电话费比北京的电话费便宜,漫游费也让你难以企及,因为加上漫游费,对你来说用重庆的电话就要比用北京的电话贵了。同样,重庆的用户也会只用重庆的电话,各个地区的用户都只用本地区的电话,全国性的统一竞争性市场就被分割成各个地区的垄断市场,而用户们也不得不支付高额的话费。在这里,博弈论所起的作用是:它预言统一市场中会出现价格战。竞争性市场里的企业相互杀价,进行价格战就是“囚徒困境”,而相互出卖是它们的选择。
另外,帆船比赛给我们提供了一个很好的机会,观察“跟随领头羊”策略的一个很有意思的反例。成绩领先的帆船,通常都会照搬尾随船只的策略。一旦遇到尾随的船只改变航向,那么成绩领先的船只也会照做不误。实际上,即便成绩尾随的船只采用一种显然非常低劣的策略时,成绩领先的船只也会照样模仿。为什么?因为成绩接近是没有用的,只有最后胜出才有意义。
跟在别人后面第二个出手有两种办法。一是一旦看出别人的策略,你立即模仿,好比帆船比赛的情形;二是再等一等,直到这个策略被证明成功或者失败之后再说,好比电脑产业的情形。而在商界,等得越久越有利,这是因为,商界与体育比赛不同,这里的竞争通常不会出现赢者通吃的局面。结果是,市场上的领头羊们,只有当它们对新生企业选择的航向同样充满信心时,才会跟随这些企业的步伐。
又比如在一个大型出租车队里,汽车经常是由调度员派给司机的。车队里既有好车,也有年久失修的老爷车。调度员可以利用他的调度权向每个司机收取一点贿赂。谁若是拒绝行贿,就一定会得到一部老爷车,而那些愿意合作的司机就会“抽到”上上好签。这么一来,调度员是发达了,但司机们作为一个群体,面对的还是他们就算不贿赂调度员也能得到的同样一些汽车。假如司机们联合起来,也许可以结束这种被迫行贿的日子,问题在于怎样才能组织起来采取行动。问题的关键不是调度员能从行贿者那里得到多少好处,而是他可以严厉惩罚那些不肯行贿的人。
以上的例子可以看出,策略思维在我们的生活中处处存在,因此,我们有必要对其进行研究,了解对手打算如何战胜我们,然后找到我们自己的最优策略,来战胜他们。
既然要研究策略思维,是否需要对每个事件都提出单独的策略,是否有共性的部分?如果没有共性的部分,那研究策略思维貌似也没有意义,因为我们根本无法穷尽所有的事件。通过研究发现,博弈场景通常分为两种。
02常见的两种博弈场景
作者经过大量的研究,发现无论是工作还是生活,我们所遇到的博弈,通常就分为两种情景:一种是相继进行的博弈,也就是会按照一个先后秩序进行,另外一种是同时行动的博弈。
针对这两种博弈作者提出了相应的法则,相继进行的博弈,法则为“向前展望,倒后推理”。什么意思?就是展望最初决策最后可能导致什么结果,利用这个信息确定自己的最佳选择。
同时行动的博弈,有两条法则:法则1---假如你有一个优势策略,请照办。法则2---剔除所有劣势策略,不予考虑,如此一步一步做下去。
这些法则看起来比较难落地,是否有相关的工具能帮助分析决策?相继进行的博弈,可以使用决策树来帮助我们进行分析,比如从普林斯顿到纽约旅行会遇到几次选择。第一个决策点是选择旅行的方式:乘公共汽车、乘火车还是自己开车。选择自己开车的人接下来就要选择走费拉扎诺·奈罗斯桥、荷兰隧道、林肯隧道还是乔治·华盛顿桥。选择搭乘火车者必须决定是在纽瓦克(Newark)换乘PATH列车还是直达纽约宾夕法尼亚车站。等到进入纽约,搭乘火车或公共汽车的人还必须决定怎样抵达自己的最后目的地,是步行、乘地铁(是本地地铁还是高速地铁)、乘公共汽车还是乘出租车。最佳决策取决于多种因素,包括价格、速度、难以避免的交通堵塞、纽约城里的最终目的地所在以及对泽西收费公路上的空气污染的厌恶程度,等等。使用决策树将上述信息画成一张图就一目了然。
同时行动的博弈,可以使用二维的表格工具进行分析,比如《时代》与《新闻周刊》的封面之争,假设有一个星期出了两桩大新闻:一是众议院和参议院就预算问题吵得不可开交;二是发布了一种据说对艾滋病有特效的新药。《时代》与《新闻周刊》编辑们选择封面故事的时候,首要考虑的是哪一条新闻更能吸引报摊前的买主?
在报摊前的买主当中,假设30%的人对预算问题感兴趣,70%的人对艾滋病新药感兴趣。这些人只会在自己感兴趣的新闻变成封面故事的时候掏钱买杂志;假如两本杂志用了同一条新闻做封面故事,那么感兴趣的买主就会平分两组,一组买《时代》,另一组买《新闻周刊》。
《时代》的编辑可以进行如下推理:“假如《新闻周刊》采用艾滋病新药做封面故事,那么,假如《时代》采用预算问题,《时代》就会得到整个‘预算问题市场’(即全体读者的30%),假如《时代》采用艾滋病新药,那么两家就会平分‘艾滋病新药市场’(即我得到全体读者的35%),因此,艾滋病新药为《时代》带来的收入就会超过预算问题。可以借助一个简单的表格,更加迅速而清晰地看出这番推理的逻辑性。
如下图所示,两列表示《新闻周刊》的对应选择,用两行表示《时代》的对应选择。这时我们得到四个格子,每一个格子对应一组策略。格子里的数字代表《时代》的销量,用购买《时代》的读者数占全体潜在读者数的百分比显示。第一行显示的是假如《时代》选择艾滋病新药,它在《新闻周刊》选择艾滋病新药或者预算问题的两种情况下的销量。第二行显示的是假如《时代》选择预算问题,它在《新闻周刊》选择艾滋病新药或者预算问题的两种情况下的销量。
这个优势策略很容易看出来。第一行的两个格子无一例外都比第二行对应的格子占优,因为第一行的两个数字都比排在同一列下面的数字大。这是优势地位的特征。
当我们使用工具帮助我们做了策略的推演,可以采取哪些行动来激发对方,最终让我们的策略得以实现。
那么,在日常工作和生活一些常见场景中,我们可以采取哪些常用的策略行动?
03常用的策略行动
面对不同场景,我们可以采取的策略行动包括:无条件行动,强迫性威胁,阻吓性威胁,强迫性许诺,阻吓性许诺,警告,保证和承诺。
无条件行动
设想美国和日本争先恐后发展高清晰度电视。虽然美国拥有技术方面的优势,却由于财*赤字越积越高,可以动用的资源实在非常有限。日本抓住美国这个短处,再次击败了它。不过,一个乍看上去可能进一步束缚美国的策略行动其实可以扭转整个局面。
在缺少无条件行动的前提下,华盛顿和东京同时开始选择各自的策略。每个国家都必须决定对研究开发的投入是高还是低;投入高,会大大缩短开发时间,当然产生的成本也更高。双方博弈会出现4种结果(下面的数字代表各自得到的利益,比如美国选择投入低的策略得到收益为4,日本也选择投入低得到的收益为3):
图源:《策略思维》
日本最愿意看到的结果是自己得到收益为4,自己选择高水平,美国却选择低水平;那样的话,它取胜的机会很大,而且资源成本问题在它看来也没那么严重。在美国看来,最理想的结果是双方同时选择低水平,那样的话,美国很有机会以较低成本打赢这一仗。
低水平是美国的优势策略。美国的问题在于,日本会早已料到这一点。日本的最佳对策是转向高水平。日本还没来得及做出决定,美国已经抢先宣布自己无条件支持这一开发项目。这就使原本同时出招的博弈变成相继出招的博弈,而且还是美国先行。美国应该宣布选择高水平,同时希望日本报以低水平。这就是这个相继出招的博弈的均衡点。
这个使美国占得有利形势的策略行动,在于单方面、无条件地宣布自己的选择。美国的这个策略行动改变了日本的预期,进而改变了它的行动。一旦相信美国会不惜一切代价选择高水平,日本就会选择低水平。当然了,等到日本拿定了主意,美国最好还是改变主意,同样回到低水平的道路上去。
强迫性威胁
比如恐怖分子劫持一架飞机,其确立的回应规则是假如他的要求不能得到满足,全体乘客都将死于非命。强迫性威胁的目的在于促使某人采取行动。
阻吓性威胁
比如美国威胁说,假如苏联出兵攻击任何一个北约国家,它就会以核武器回敬。阻吓性的威胁的目的在于阻止某人采取某种行动。
强迫性许诺
为寻找证人,检察官会向一个被告许诺说,只要他愿意成为公诉方的证人,检举同案中的其他被告,他就会得到宽大处理。强迫性许诺的用意是促使某人采取对你有利的行动,比如让被告摇身一变成为公诉方的证人。
阻吓性许诺
阻吓性许诺的目的在于阻止某人采取对你不利的行动,比如黑帮分子许诺会好好照顾证人,只要他答应保守秘密。
威胁与许诺的界限非常模糊。比如一个朋友在纽约市被抢了钱,却得到下面这个许诺:只要你“借给”我20美元,我许诺一定不会伤害你。相比之下更加性命攸关的还是这个歹徒没有明说的威胁:假如我们这个朋友不肯“借给”他20美元,他就一定会受到伤害。威胁与许诺的界限只取决于你怎样称呼当前的情形。
一切威胁与许诺的共同点在于:回应规则使你不会在没有回应规则的前提下采取行动。假如这个规则只是泛泛地指出,无论什么时候你都会采取最佳行动,那就跟没有规则差不多。说明什么事情会在没有规则的情况下发生,仍然具有一种公告天下的作用,这些说明称为警告与保证。
警告
警告就是实践一个“威胁”对自己有利,比如假设总统警告说他会否决一个他不喜欢的法案,这只不过是表明了他自己的意图。警告的用意在于告知其他人,他们的行动将会产生什么影响。
保证
保证就是实践一个“许诺”对自己有利,比如孩子不理会关于炉子顶部很热的警告,结果烫伤了,这使父母得到某种保证,知道孩子以后再也不会这么干了。
需要注意,威胁与许诺是真正的策略行动,而警告与保证更多的是起一个告知的作用。警告或者保证不会改变你为影响对方而设立的回应规则。与此截然相反,威胁或者许诺一旦时机来临,就会改变你的回应规则,使之不再成为最佳选择。这么做不是为了告知,而是为了操纵。
由于威胁和许诺表明你可能选择与自身利益冲突的行动,这就出现了一个可信度的问题。等到别人出招之后,你就有动机打破自己的威胁或者许诺。这就引出了可信的承诺。
承诺
承诺是为了改变博弈的结果,通过遵守自己的承诺成为符合我们自身利益的选择,把威胁变成警告,把许诺变成保证。
要遵守承诺,首先需要建立和利用信誉,让双方写下合同。假如你在博弈当中尝试了一个策略行动,然后反悔,你可能就会丧失可信度方面的信誉。若是遇到百年一遇、千载难逢的情况,信誉有可能显得不那么重要,因此也没有多大的承诺价值。不过,一般情况下,你都会在同一时间跟不同对手进行多个博弈。因此你就有建立信誉的动机,而这就相当于做出一个承诺,以使自己的策略行动显得可信。
要使你的承诺显得可信,一个直截了当的办法就是同意在你不能遵守承诺的时候接受某种惩罚。合同就是确保承诺得以遵守的手段。为使合同方式奏效,负责强迫执行承诺或者收取罚金的一方必须具备某种独立的动机完成自己的任务。
合同方式更加适用于商业交易。违反合同一般都会造成破坏,因此,受害方一定不愿意善罢甘休。比如,一个制造商就可能要求一个没能按时送货的供应商支付罚金。这个制造商不会对供应商究竟有没有送货漠不关心。他更愿意得到的是自己订购的货物,而不是罚金。在这种情况下,对这份合同进行再谈判将不再是双方都觉得有意思的选择。
以上虽然说明了在两种常见的博弈场景下,可以采取相应的策略行动,来让我们战胜对手,但是使用策略仍然存在不可预知的风险。
04不可预知的风险
网球的首要策略教训之一,就是不到最后一瞬不要选定一个方向。设想有这么一对具备特殊技巧的网球选手。接球者的正手稍微强一些。假如他的预计正确,他的正手回球有90%的机会获得成功,而反手回球的成功率只有60%。当然,假如他跑向一方而对方发出的球飞向另一方,那么,回球的质量就会大打折扣:假如他跑向反手一方,而对方发出的球飞向他的正手一方,他能及时转向而成功回球的概率只有30%;反过来,他的成功率只有20%。
图源:《策略思维》
假如发球者永远瞄准对手的正手,接球者就会预计到球会朝自己的正手而来,从而有90%的概率回球成功。假如发球者永远瞄准对手的反手,接球者也能预计到球会朝自己的反手而来,从而有60%的概率回球成功。
假设发球者在每次发球前都会在自己的脑子里投掷一枚假想的硬币,根据硬币出现正面或者反面决定自己的发球应该瞄准对手的正手还是反手。猜测准确的概率只有50%。猜测准确的时候,正手回球的成功概率是90%;而猜测出错的时候,接球者及时转向而成功回球的概率只有20%。因此,他的整体成功概率是
55%。通过类似的计算可以知道,若是向反手方移动,他的整体成功概率是45%。
在发球者采取50∶50混合策略的前提下,接球者若是从自己的角度出发,就能选出最佳回应策略。他应该向正手方向移动,这么做,成功回球的概率达到55%。假如发球者永远将球发向一方,分别是接球者的正手方和反手方,那么,接球者的成功回球概率分别为90%和60%。
图源:《策略思维》
发球者瞄准对方正手方向的概率是一条从0到%的水平线。对于所有这些混合策略,图中有两条线,一条显示接球者准备向正手方移动的成功回球概率,另一条则显示他准备向反手方移动的成功回球概率。举个例子:假如接球者准备向正手方移动,概率为0的向正手发球的策略(即%地向反手发球的策略)就能使接球者的成功回球概率维持在20%的低水平,而%地向正手发球的策略则会使接球者的成功回球概率达到90%。接球者的成功回球概率从一端直线上升到另一端。
两条直线交于一点,在这一点上发球者只有40%的时间将球发向对方正手方。在交点的左边,接球者若是预计对方会将球发向反手方,那么他的成功回球概率就会提高;而在右边,他若是预计对方会将球发向正手方,成功回球概率也会提高。
向正手和向反手发球维持在40∶60的混合策略,是唯一一个不会让接球者用上述方法占便宜的选择。只有选择这种混合策略,接球者无论选择防守正手还是反手,其成功回球概率都是一样的。两种情况都会留给接球者48%的成功回球概率。发球者若是采取其他任何一种混合策略,只要接球者善加利用,就能使自己的成功回球概率沿着图中的两条直线上升到交点之上,也就是超过48%。因此,40%的时间瞄准对方的正手就是发球者的最佳策略。
假如接球者一半时间向正手方移动,一半时间向反手方移动,他的新的收益曲线就是原来两条直线的平均值,以点线显示。由于这条直线是向上延伸的,其最小值永远出现在左端,该点的成功率为40%。无论接球者向两方移动的比例是多少,这条直线一定经过成功率为48%的那一点,这是因为发球者可以选择采用40∶60的混合策略。假如这条直线出现任何倾斜,那么,它的一端一定落在48%以下。只有在接球者的混合策略为30∶70的时候,这条直线才会变成一条水平直线,最小值变成48%。因此,最大值的最小值等于最小值的最大值——48%。
图源:《策略思维》
所有混合策略的均衡具有一个共同点:每个参与者并不在意自己在均衡点的任何具体策略。一旦有必要采取混合策略,找出你自己的均衡混合策略的途径就在于使别人对他们自己的具体行动无所谓。虽然这听上去像是一种倒退,其实不然,因为它正好符合零和博弈的随机化动机:你想阻止别人利用你的有规则的行为占你的便宜。
在网球比赛的例子中,当发球者采取自己的均衡策略,按照40∶60的比例选择攻击对方正手方和反手方时,接球者的成功率为48%。如果发球者采取其他比例,接球者的成功率就会上升。此时应该采取混合策略。
假设你是网球比赛例子里的接球者,而发球者已经选择了他的最佳混合策略,即40∶60的混合策略。那么,无论你向正手方还是反手方移动,又或是时而正手方,时而反手方,你的成功回球率都是48%。意识到这一点,你可能打算免掉计算自己的最佳混合策略的麻烦,只随便选定一种行动,并指望对手选择他的最佳混合策略。问题在于,除非你选择自己的最佳混合策略,否则你的对手就没有动机选择他自己的最佳混合策略。所以,你需要选择自己的最佳混合策略,来迫使对方继续使用他的最佳混合策略。
分析完以上内容,最后作者分几个章节讲了在几个典型的场景中,该如何使用策略思维。
05策略思维在几类场景中的使用
在什么情况下使用边缘*策?
在美国希望苏联从古巴撤出导弹的前提下,肯尼迪为什么不直接威胁说,假如赫鲁晓夫不拆除那些导弹,他就会将莫斯科夷为平地?在实践当中,这么一个威胁不会有人相信,赫鲁晓夫不相信,其他什么人也不会相信。不错,这个威胁中提到的行动将会引发一场全球性的核战争,但这个危险本身实在太夸张了,以至于让人难以置信。假如导弹没有在最后期限之前撤离,肯尼迪一定不愿意将整个世界夷为平地,而更加愿意考虑延长留给苏联的最后期限,推后一天,再推后一天,如此下去。
虽然表明战争必然爆发的确定性的威胁并不能让人信服,但表明战争可能爆发的风险或概率却可以变得可信。假如赫鲁晓夫不肯退让,就会出现一种风险,而不是一种确定性,表明导弹可能发射。这种不确定性降低了这个威胁的程度,从而使美国觉得这个威胁比较容易承受,因此在苏联看来也更加可信。
另一个提高可信度的办法相似--小步前进,每一步都包含一定程度的风险。美国或苏联方面的每一次不让步都会加大爆发世界大战的风险;而他们的每一个小的让步则都会减少这个风险。假如肯尼迪愿意走得比赫鲁晓夫更远,那么肯尼迪的边缘*策就会取胜。
当一座陡峭的悬崖被一道光滑的斜坡取代时,就连肯尼迪本人也不知道安全的界线究竟在哪里。这就好比他在玩一场核战争的俄罗斯轮盘*,而不是投一个骰子。有一个数字会引发大灾难,但他并不知道究竟是哪个数字。假如当真出现这个数字,他不可能改变主意再投一次。在与理性的对手较量时,没人愿意越过核战争的边缘,却有可能由于一个错误而滑下那道光滑的斜坡。边缘*策创造了一种刚刚超出控制的情况,故意掩盖了那道悬崖。
边缘*策的风险与混合行动的概率元素存在根本区别。边缘*策是你愿意在事实发生前创造这个风险,却在时机来临时不愿意将这个风险付诸实践。要想让你的对手相信你威胁的后果一定会发生,你还要借助其他一些渠道。最常见的是采取超出你的控制的行动。
无论怎样运用边缘*策,总有一种跌落边缘的风险。虽然策略家们回顾古巴导弹危机的时候会把它当做边缘*策的一个成功应用,但假如超级大国之间爆发一场战争的风险变成现实,幸存者一定会责怪肯尼迪完全没有考虑后果,毫无必要地就把一场危机升级为一场灾难。不过,说到运用边缘*策,跌落边缘的风险经常会变成现实。更好的策略是远离边缘。
在什么情况下使用合作与协调?
20世纪50年代,美国的常春藤联校面临一个问题。每个学校都想派出一支战无不胜的橄榄球队,结果发现各个学校为了建立一支夺标球队而过分强调体育,忽略了学术水准。不过,无论各队怎样勤奋训练,各校又是怎样慷慨资助,赛季结束的时候各队的排名却和以前差不多。大学体育比赛的刺激性同等地取决于两个因素,一是竞争的接近程度以及激烈程度,二是技巧水平。
常春藤联校的例子中可以看到,要避免过度竞争的诀窍在于建立一个卡特尔,限制竞争。高校学生面临的问题是卡特尔不容易查出作弊行为。对于这个学生集体,作弊者就是那个花更多时间学习,企图跑到别人前面去的学生。很难说得清谁有没有偷偷学习,除非等到他们在测验里“一枝独秀”的那一天。但那时已经太晚了。很难安排一个自动执行的卡特尔协议。不过,若有一个外人专门负责执行这个限制竞争的协议,情况就会大为改观。现在有不少国家之间的合作,以及企业之间的合作,已经在开始这样操作。
在什么情况下使用投票的策略?
现在的总统选举已经强调了副总统选择的重要性。此人距离总统宝座只有一步之遥。不过,大多数总统候选人完全忽略了选票上的第二个名字,而大多数副总统看来并不喜欢自己的位置。无所事事地等上4年或8年时间,等待自己的老板驾鹤西去,这样的事情当然不是随便什么人都适合从事的职业。
美国宪法只有一个条款规定副总统的一切实际行动。第1章第3.4节提到:“美利坚合众国副总统担任参议院主席,却不得投票,除非参议员分为势均力敌的两派。”这种主持工作属于“礼节性质,无所事事的礼节性质”,而在大多数时候副总统都会将这一工作转交由参议院多数*领导人指定的资历较浅的参议员轮流负责。
关于副总统的一票只有礼节意义的描述却有误导的性质。副总统这一票的影响力比其使用频率更为重要。仔细衡量一下,就会发现副总统这一票的重要性大致相当于任何一名参议员的投票。副总统的投票一般只在决定最重要和最具决定意义的议题时起作用。一张选票可能有两种效果:一是决定结果,二是成为影响胜利或失败比数的一种“声音”,却不能扭转结果。而在一个类似参议院这样的决策团体里,第一种效果更加重要。
缺少分界线的理论可以追溯到希腊哲学家芝诺,他提出了这个有关一次取一颗沙砾而聚沙成塔的似是而非的理论。没有一颗沙砾可能将无塔变成有塔,这似乎不错,然而,足够的沙砾也可以将一个鼹鼠丘变成一座小山。一张选票好比一颗沙砾。很难想象单单这额外的一票怎么能够扭转别人对结果的看法。
要想避免你的选票淹没在众人的选票里,一个办法就是别出心裁:选择一个极端的立场,与众人划清界限。谁若是认为这个国家过分自由化,可以把票投给一个温和保守派候选人。好比候选人做出妥协,采取中间立场那样,使自己的选票显得比实际意愿更极端可能符合某些选民的利益。这种战术只在一定程度范围内有效。假如你走过了头,大家会认为你是一个想入非非的疯子,结果没人理睬你的意见。
采取中点立场的法则的优点在于,没有一个选民愿意歪曲自己的偏好;诚实投票是每一个人的优势策略。采取中点立场的唯一问题在于它的应用范围非常有限。这一策略只在一切都可以简化为一维选择的前提下可以采用,比如对自由派和保守派的选择。不过,并非所有情形都可以这样简单划分。一旦选民的偏好超过一维,就不会再有什么中点可言。在这个时候,操纵这一体系的可能性就变成现实了。
在什么情况下使用讨价还价策略?
决定如何划分利益大饼的一个重要因素是各方的等待成本。虽然双方可能失去同样多的利益,一方却可能有其他替代做法,有助于部分抵消这个损失。假定工会与管理层谈判期间,工会成员可以外出打工,每天挣美元。于是,每次轮到管理层提出反建议的时候,出价不仅不能低于工会将在次日得到的收入,同时当天的数目至少要达到美元。
这一结果可以看做平均分配原则的一个自然修正,使双方有可能从一开始已经处于不同地位,好比高尔夫球比赛的做法,为强手设置不利条件,为弱者设置有利条件,锄强扶弱。工会从美元开始,这是其成员在外打工可能挣到的数目。余下只有美元可以谈判,原则是双方平均分配,即各得美元。因此,工会得到美元,而管理层只得到美元。
在其他情况下,管理层也有可能处于有利地位。比如,管理层一边与工会谈判,一边发动不愿参加罢工的工人维持酒店营业。不过,由于这些工人的效率比较低或者要价更高,又或是由于某些客人不愿意穿越工会竖立的警戒线,管理层每天得到的营业收入只有美元。假定工会成员在外面完全没有收入。这时工会愿意尽快达成协议,根本不会当真发动一场罢工。
假如工会成员有可能外出打工,每天挣美元,同时管理层可以在谈判期间维持酒店营业,每天挣美元,那么,余下可供讨价还价的数目只有区区美元。管理层最后得到美元,而工会得到美元。一个具有普遍意义的结论是,谁能在没有协议的情况下过得越好,谁就越是能从讨价还价的利益大饼中分得更大一块。
在什么情况下使用激励策略?
假定你自己是加利福尼亚一家高科技公司的老板,打算开发和推出一种新的电脑象棋游戏,名为“巫师1.0”。如果你成功了,你将得到20万美元的销售收入。如果你失败了,你将一无所获。成功或失败完全取决于你的专业棋手兼程序员的工作。她要么全神贯注,全力以赴;要么敷衍了事,得过且过。假如她有高质量的工作表现,那么,你成功的机会将达到80%;假如她只是得过且过,这一比率将降到60%。
得过且过的工作表现带来20万美元收入的概率只有60%,结果等于平均12万美元;减去5万美元工资,平均利润等于7万美元。假如你请到的是一个具有高质量工作表现的专家,通过同样的计算,得到平均利润等于9万美元(即20万美元×80%-7万美元)。很显然,你用高工资请一个有高质量工作表现的专家比较合算。
由于你看不出工作表现的质量是高还是低,你不得不将你的回报机制建立在一个你可以看得出区别的东西的基础之上。在我们讨论的这个例子中,这个东西可能是最后结果,即整个程序编制工作的成功或失败。这当然与工作表现有关,虽然这一关联并不完美,但是,工作表现的质量越高,意味着成功的概率也越高。这一关联可以用于创造一个激励机制。
罚金/奖金机制或股份平分方案的另一个难处在于风险问题。工人一旦参加这个10万美元的博弈,她的激励就会提高。但是,这个重大风险可能无法通过最后结果的统计平均值进行评估。遇到这种情况,工人因同时提供高质量工作表现和承担风险,应该得到补偿。风险越大,补偿越高。
许多制造或供应合同,尤其是来自*府方面的合同,有时也有私营公司的合同,是通过密封投标的招标决定判给哪一家。每一家公司提交一个密封的信封,里面开出它愿意接受这项工程的价码。然后,所有标书放在一起进行比较,开价最低的公司胜出,同时得到它所要求的价码。
假定现在有这么一份合同,比方说是建设一段高速公路,而你是一个投标者。你的成本(包括正常情况下你希望投资能够获得的回报)是0万美元。你并不知道你的竞争者的成本,可能甚至不晓得他们究竟都是些什么人。不过,你有理由相信,他们的成本应该介于万美元到1万美元之间。他们当中,最佳投标者的开价落在两个极端之间任意一个数目的概率均等,也就是说,以这一范围为横轴,以每百万美元为一点,那么,落在任意一点的概率都是1/10。
你永远不会开出一个低于你的成本的价码。比如,假定你开价万美元。如果你没能胜出,当然没问题;但若是你赢了,你得到的价码将低于你的成本。你这么做等于自掘坟墓。若最后定价是0万美元,这个数目只够弥补你的成本,那么这份合同对于你则可有可无。开出一个抬高的价码对你而言是一个好的策略;用博弈论的术语来说,这个策略优于诚实开价。其他参与者其实也在打同样的主意,到了最后,所有开价都被抬高了。
在英式拍卖中,所有投标者聚集在同一个房间,拍卖官依次叫出越来越高的价码。出价过程一直持续到只剩下一个投标者为止——一次,两次,成交!倒数第二个投标者应该只在价码超出自己估价的时候退出。于是,对该项物品估价最高者将如愿以偿,而他只需支付次高开价。
一个不同寻常却又真实可信的答案是,平均而言,两种机制将得出完全相同的结果。在*府为一个道路工程征集标书的案例中,将合同判给出价最低者而非出价次低者的做法,表面看来似乎具有节约预算的优势,但只要我们明白投标者有怎样的对策,确切地说就是抬高他们的出价,这一优势也就荡然无存。开价最低者得到合同,同时得到他开出的价钱,但这个价码早已被抬高了。若是对这一问题进行一个全面的数学分析,结果将显示,这个常规做法带来的预算影响,恰好等同于以第二开价支付胜方的做法的影响。在赢得招标拍卖的条件下,一家公司的最优化开价应该是次佳竞争者的预期成本。在使用激励策略时,注意结合合同、拍卖、招标等方式。
看似有很多的策略行动,比较难记住,对于我们来说,不妨记住两个分析的工具(决策树(相继进行的博弈)和二维四象限工具(同时进行的博弈)),然后遵循相应的法则来选择自己的最优策略。