两难选择,合作还是背叛
1950年,由就职于兰德公司的梅里尔·弗勒德(MerrillFlood)和梅尔文·德雷希尔(MelvinDresher)拟定出一种相关困境的理论,后来由顾问艾伯特,塔克(AlbettTucker)以囚徒方式阐述,并命名为“囚徒困境”。这也是关于博弈论流传最广的一个故事,在哲学、伦理学、社会学、政治学、经济学乃至生物学等学科中,获得了极为广泛的应用。
故事有很多版本,大意是这样的:
有一天,一位富翁在家中被杀,财物被盗。警方在此案的侦破过程中,抓到两个犯罪嫌疑人,并从他们的住处搜出被害人家中丢失的财物。但是,他们矢口否认曾杀过人,辩称是先发现富翁被杀,然后只是顺手牵羊偷了点儿东西。于是警方将两人隔离审讯。检察官说:“你的偷盗罪确凿,所以可以判你1年刑期。但是,我可以和你做个交易。如果你单独坦白杀人的罪行,我只判你3个月的监禁,但你的同伙要被判10年刑。如果你拒不坦白,而被同伙检举,那么你就将被判10年刑,他只判3个月的监禁。但是,如果你们两人都坦白交代,那么,你们都要被判5年刑。”
显然最好的策略是双方都抵赖,结果是大家都只被判1年。但是由于两人处于隔离的情况下无法串供。那么,囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方的选择;而即使他们能交谈,还是未必能够尽信对方不会反悔。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何做出选择:
若对方沉默,背叛会让我获释,所以会选择背叛。
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
两人面对的情况一样,所以两人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的平衡,就是双参与者都背叛对方,结果两人同样服刑5年。
这样两人都选择坦白的策略以及因此被判5年的结局,被称为“纳什均衡”,也叫非合作均衡。从这里可以引出一个悖论:从利己的目的出发,结果却损人不利己。两个囚徒的命运就是如此。从这个意义上说,我们还可以悟出一条真理:合作是有利的“利己策略”
但它必须符合以下黄金律:也就是我们常说的“己所不欲,勿施于人”,且前提是“人所不欲,勿施于我”o
纳什均衡的贡献是,证明了在这一类的竞争中,在很广泛的条件下是有稳定的解存在,只要是别人的行为确定下来,竞争者就可以有最佳的策略。他的这项理论工作使得博弈论从此成为经济学家用来分析从商业竞争到贸易谈判种种现象的有力工具。
现实中,无论是人类社会或大自然都可以找到类似囚徒困境的例子:
在政治学中,两国之间的军备竞赛可以用囚徒困境来描述。两国都可以声称有两选择:增加军备(背叛)、或是达成削减武器协议(合作)。两国都无法肯定对方会遵守协议,因此两国最终会倾向增加军备。似乎自相矛盾的是,虽然增加军备会是两国的“理性”行为,但结果却显得“非理性”(例如会对经济造成损害等)。这可视作遏制理论的推论,就是以强大的军事力量来遏制对方的进攻,以达到和平。
学中,表现为关税战。两个国家,在关税上可以有两个选择:
提高关税,以保护自己的商品。(背叛)
与对方达成关税协定,降低关税以利各自商品流通。(合作)
当一国因某些因素不遵守关税协定,独自提高关税(背叛),另一国也会做出同样反应(亦背叛),这就引发了关税战,两国的商品失去了对方的市场,对本身经济也造成损害(共同背叛的结果)。然后两国又重新达成关税协定。(重复博弈的结果是将现共同合作利益最大)
商业中,以广告战为例:两个公司互相竞争,它们的广告互相影响,即一个公的广告较被顾客接受则会夺取对方的部分收入。但若两者同时期发出质量类似(广告,收入增加很少但成本增加。但若不提高广告质量,生意又会被对方夺走。
这两个公司可以有两个选择:
互相达成协议,减少广告的开支。(合作)
增加广告开支,设法提升广告的质量,压倒对方。(背叛)
若两公司不信任对方,无法合作,背叛成为支配性策略时,两公司将陷入广告战,而广告成本的增加损害了两公司的收益,这就是陷入囚徒困境。在现实中,要两个互相竞争的公司达成合作协议是较为困难的,多数都会陷入囚徒困境中。
除了上述领域,在生活中,往往也有很多囚徒博弈的例子,比如有这样一个故事:两个旅行者麦克和约翰从一个以出产瓷器的著名旅游胜地回来时,他们各买了一个瓷花瓶。提取行李时,发现花瓶被碰破了,他们向航空公司索赔。
航空公司估计花瓶的价格在80—90元左右,但不知道这两位旅客购买的准确价格。航空公司要求两位旅客在100元以内,自己写下花瓶价格。若两人写的相同,说明他们说了真话,就照他们写的数额赔偿;如果两人写的不一样,那就认定写得低的旅客讲的是真话,按这个低的价格赔偿,但是对讲真话的旅客奖励2元钱,对讲假话的旅客罚款2元。
如果两人都写100元,他们都会获得100元。但是,假定约翰写100元,麦克改写99元,则他会获得IOI元。约翰又想,若麦克写99元,他自己写98元,比写100)c好,因为这样他获100元,而自己写100元当麦克写99元时自己却只获97元。而给足约翰写98元,麦克又会写97元…oo。这样,最后落得两个人只写1元的境地。双输,这就是囚徒困境带来的结果。
再有,一个小镇政府有一个为期一年的采购计划,每个月采购一批饮料。如果小上的两家饮料公司的报价一致,那么政府就把订单一分为二。否则,政府会把更多的订单给报价低的那个公司。显然,这两家公司都报出同样的高价,才符合其利益。在这种多次博弈中,他们会联合起来出高价吗?如果会,那么在一年12次的博弈中他们会合作几次呢?
如他们开始签订了合约,都报出一个比较高的价位。不过,显然最后一次他们不需要遵守合约,因为反正以后没有采购计划了,违约也不会有什么坏处。如果是这样,倒数第二次也不需要遵守合约,因为不论怎样倒数第一次都是要违约的,那就不存在是否有惩罚的问题。所以倒推下来,一次合约都不用遵守。两家公司最后可能还是两败俱伤。
如果你有兴趣,还可以做一个实验:选定几个人,让他们都猜一个数字,必须是1或100之间的整数。条件是谁最接近所有实验者的所猜数字平均值的1乃,谁就可以得到100块钱。
这个时候,每一个人都会想:如果一开始其他人都是随机地选择数字,50就会是所有人的猜测。这个时候,猜50的13也就是大约17可能会赢。然而,每一个人都会猜到17这个数字的时候,大家就会猜测17的13,也就是6左右。依此类推,这个游戏中的每一个人最终猜测的结果是唯一最小的数字,那就是1。
们可以看到,在“囚徒困境”中,每一方在选择策略时,都只是选择对自己最有利的策略,而并不顾及其他对手的利益和社会效益。表面上看,这种策略组合是由当事双方各自认为的最佳策略构成。实际上,双方都选择拒绝招供才是真正的最佳策略,因为这样才会使两个人都无罪释放,双方都获得最大利益。但是,没有人会主动改变自己的策略以便使自己获得最大利益,因为,这种改变会给自己带来不可预料的风万一对方没有改变策略呢?
就是“囚徒困境”中的两难境地,生活中如果遇到类似困境该怎么办?有什么解决的办法吗??下面来谈。