囚徒们的困惑
(博弈论漫谈之二)
人,活在世上这一辈子,不知道要经历多少挑战作出多少选择,而且每一次选择都可能对其以后的人生轨迹有着难以尽述的影响。虽然说我们人人都有自私的基因,想把自己的利益最大化,但没有人能有足够好的运气,能够保证每一次选择都是最为利己的。很多时候,利益最大化选项的背后隐含着的也是风险最大。所以,追求极致,未必对所有人都是一个理所当然的选择。好在我们人类的生物思维体系中,有一个能自我修饰自我调整的回路,这就使得我们能够在上一次的选择之后,观察外界的反馈,从而获得经验获得教训获得奖励,并以此作为下一次抉择的依据。
上世纪五十年代有两位美国数学家设计了一个游戏,以期通过参与者相互之间的互动,来考察人际间交往信任合作的关系。这个游戏就叫“囚徒的困惑”。它的设计思路是这个样子的:假如你和你的一个朋友被警察指控犯了重罪(当然,你们可能是真干了点什么,也可能是被诬陷的,实际什么都没干),你们被捉进了监狱。在你们还没来得及相互询问沟通一下情况,警察就把你们隔离开来开始单独审讯了。
警察刚一开始要做的,肯定是依照惯例,向你交代明白了党的坦白从宽抗拒从严的伟大政策, 而且厉声告诉你,你的朋友在无产阶级专政铁拳的震慑下,早就放弃了抵抗,把所有的一切都招了,他指控你也犯了罪。(这是什么朋友啊。不过现实中肯定是有这样的人的。另外,警察说的可能是真的,也可能是吓唬你的谎话,这事在哪儿都一样)。接下来事态的发展,会根据你们不同的应对产生以下四种可能的结果:
A. 如果你不承认被指控的罪行,而且你的同伴也否认了指控,这案子就很难站得住脚,最终的判决会是很轻的,这对你和同伴来说算是双赢的结局,在博弈理论中被称作是合作。当然,在当时的情形下,你根本不可能知道你的同伴会怎么做。
B. 如果你坦白承认了罪行,而且你的同伴也坦白承认了罪行,这样,警察没花太大的力气就做实了案子,大功一件。被认定是犯了罪的你们两人肯定是逃脱不掉法律的制裁的。当然,政府也是说话算话的,他们还是会落实坦白从宽的政策,让你们实际得到的惩罚比理应得到的轻了不少。但不管怎么说,对你和你的同伴而言,这还是算作一种双输的结局。
C. 但是如果你声称无辜拒绝认罪,而你的同伴却在另一间屋子里全都承认了。那么,这样情形带来的结局对你最为不利,你会得到最为严厉的定罪惩罚,而你的同伴会得到最轻的甚至没有处罚。于是,你会受到双重打击,最为悲催;而你的同伴或说是朋友,却背叛了你,在博弈理论中,那会被称为变节。这是你输他赢的结局。
D. 与C类同,如果你是变节的一方,你的朋友是死不松口的一方,他最终会得到最倒霉的结局,是他输你赢。
好了,知道了党的政策,和不同情况可能带来的结果后,让我们再把利弊认真梳理一下。首先,如果你和你的朋友(同伙)很默契,合作得天衣无缝,无论是拒绝指控还是承认罪行都能做到步调一致,你们两人就都能避免最坏的可能结局。但是,如果你要是想求稳妥,不追求极端的满意结果,也避免最差的结果,就老老实实认怂,承认罪行是你们干的,这也是条不差的选择;而且,在这种情况下,如果你的同伙负隅顽抗,拒绝认罪,那你会得到意外奖赏,没准最后脱离惩罚也未可知。
把这些都想清楚了,你应该能意识到,无论你的同伴怎么做,你的最优选择其实是变节而不是追求与他同进同退口供一致的合作。同样,如果你的同伙不傻,他也会得到相同的推论。也就是说,按照理智的推理,追求双赢结果的风险是最大的,它有可能对你个人的最终结果是最差,造成你输他赢的结局。为了避免这一最糟糕的情况出现,你和同伴最可能作出的决定应该都是变节。所以,如果你们两个人都是冷静理性的,很大的可能,在一开始你们就已经决定要双输了。这就造成了所谓的“囚徒的困惑”。
接下来,让我们进一步设想一下。如果这个博弈过程有重复做下去的可能,局中人的行为会发生什么样的变化呢?这样的情形实际是增加了一个反馈机制,它让参与者能够根据自己受到的惩处,来推测同伴上一次的行为,并以此来反思以前的决定及调整下一步的选择策略。于是,一方参与者的行为对另一方来说就是一个返喂伺服信号,你的变节可以造成对方下一次的变节,你一次自我牺牲,可能就会给以后的长期合作埋下伏笔。其实这也是一个隐藏着的自然规律。
三十年前,密执根大学的社会心理学教授Robert Axelrod,使用计算机把这个博弈游戏在加多了人加多了回合的情形下推演了下去,他发现,赢得最终胜算的策略好像很简单,无论你被别人利用了多少,被占了多少便宜,你都应该寻求合作,而不是变节,也就是按照我们上一篇讲到的金色定律来出牌:你想别人怎么待你,你就怎么待人。高尚赢得胜利,很好。
但是,当这些参与者之中混进了像是曹操那样的人物的时候,不管别人怎么行善,他都按自己能得到最大利益的可能性来出牌,金色定律策略就失效了,因为曹操做出来坏事后,要是得不到负面的反馈,他就会永远这么做下去,一颗老鼠屎就会坏了一锅粥。
所以,为了让群体系统的长期共赢局面演变出来,必须引入另一个处事原则——铜色定律和环环相报原则。