友情提示:如果本网页打开太慢或显示不完整,请尝试鼠标右键“刷新”本网页!阅读过程发现任何错误请告诉我们,谢谢!! 报告错误
3C书库 返回本书目录 我的书架 我的书签 TXT全本下载 进入书吧 加入书签

纳什均衡与博弈论-第13章

按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!




  当我拜访马丁·诺瓦克时,他强调人类的这种与非家族成员之间的合作是人类区别于地球上其他生物的主要特征之一。另一个特征是语言。“我认为人类在两个方面与其他动物有本质区别,”他说道,“一方面是人类拥有自己的语言,这样,我们可以使用该语言去谈论一切事情。其他任何生物都没有进化到拥有一个系统来达到无限制交流的状态。动物可以相互交流很多事情,也可以发出一些信号,但是这种交流只是在一些有限的事情上进行。”

  尽管人类有一种“组合的”语言,与之相适应和匹配的声音系统可以描述任何情况下的事情,即使那些事情是他们从来没有遇到过的。“在进化过程中一定有转折点,”诺瓦克说道,这种转变允许人类形成“无限的”交流系统。如此灵活的语言系统毫无疑问地促进人类形成其他方面的差别——广泛的合作。“人类是能够解决非家族成员之间广泛合作的唯一物种,”诺瓦克指出。“非家族间的个体合作是非常有趣的,因为竞争才是进化的动力,如果你想最适应的生存下去,必须和别人竞争,但是这种竞争很难解释合作产生的原因。”

  达尔文认为这是“利他主义”。表现得有利于他人——以一定的代价帮助其他人,而自己没有得到什么益处——这在生存斗争中看起来是相当愚蠢的行为。但是人类(他们中的许多人,至少是有些人)拥有助人为乐的良好品德。作为一个好人一定具有某种生存优势,无论是不是里奥·杜罗切想的那样(他是20世纪中期棒球队的负责人,他因为说过“好人总是最后一名”这句话而出名)。

  一个早期的猜想认为利他主义以某种方式有利于利他主义者,像相互的共同利用。如果你帮助你的邻居解决一个问题,也许有一天他也会帮助你(这是“互惠的利他主义”的概念)。但是,这种解释不是很充分。这种回报只有在将来你能够遇到曾经帮助过的人时才起作用。然而人们经常帮助一些陌生人,这些人也许以后再也遇不到。

  可能你仍有可能因为曾经帮助过别人而间接得到好处。假设你帮助一个陌生人并再也没有遇见过,但是那个陌生人由于你的善良帮助而感动,他也因此成为心地善良、乐于助人的人,给所有有困难的人提供帮助。某一天,其中一个受过他帮助的人会遇到你,并且帮你解决问题,感谢那次经历——你鼓励过那个乐善好施者。

  这种“间接的互惠”,诺瓦克告诉我,已经很早就被生物学家理查德·亚历山大提到过,但是却经常被进化生物学家忽视。当你听到这时,你会感觉有点牵强。尽管如此,诺瓦克已经与维也纳的数学家卡尔西格·雷蒙详细地讨论过间接互惠的观点。最近,他们发表一篇文章,用博弈论中的数学知识说明间接互惠如何才能实际起作用。利他主义的秘密,诺瓦克认为,是声誉的力量。“通过帮助别人,我们会提高自己的声誉,”他说,“而且在群体中的好名声会增加别人帮助你的机会。”

  名誉的重要性解释了为什么人类语言变得很重要——所以人们喜欢说闲话。闲话传播人的名誉,使得利他主义的行为更可能根据名誉来实施。“人们要花费多少时间来谈论别人,好像人们一直都在评价他人的名声,这个问题很有趣,”诺瓦克说。“语言帮助合作性行为的发展,反之,合作也促进语言的演化。一个合作的群体使语言变得更重要……在间接互惠的情况下,你可以观察一个人,看他如何表现,或者更有效地,你可以直接和他说话……完成这些事,语言是非常必须的。”

  名誉滋生合作,因为它允许人在生活博弈中更好地预测他人的行为。在囚徒困境游戏中,例如,如果两个囚徒相互合作的话,那么他们都会出狱。但是你如果怀疑你的对手会不合作,那么你最好背叛他。在一轮只有一颗子弹的枪击游戏中,如果遇到不出名的对手,聪明的玩法是背叛他。然而,如果你的对手是位信誉很好的合作者,那么与他合作是很好的主意,这样你们两个都会受益。在重复博弈的情况下,合作会提高你的名誉。

  第五节 以牙还牙策略

  关于名誉的闲话可能还不足以创造一个合作的社会。数学计算表明间接互惠会给大的社会带来一些利他行为,而这些行为可能会导致发生某些问题。诺瓦克和西格蒙德的间接互惠模型受到几位专家的批评。他们指出,这种模式只能在种群规模小的群体中起作用。2004年在波士顿召开的复杂性会议上,我再次遇见诺瓦克时,他的分析已经变得很详尽了。

  在与他的谈话中,在分析合作进化论时,他重新阐述了囚徒困境中博弈的角色。该理论的背景是出自1980年一个著名的博弈论比赛,组织这场比赛的是密歇根大学的政治科学家艾克斯·罗德。他用囚徒困境博弈来测试博弈理论家自身的能力强弱。他邀请博弈论专家们参加这一比赛,并以计算机程序的形式提交一种策略来进行囚徒困境博弈,然后在循环赛中让这些程序互相斗争。每一个程序都会与其余程序进行互相斗争,最终以达尔文观点来决出最适应的策略。

  在14个提交的策略中,赢者是用最简单的方法——一个模拟的方法称为以牙还牙,这个策略是由博弈理论家阿纳托尔·拉波波特想出的。在以牙还牙的策略中,游戏者在第一轮中采取合作方案。然后,在下一轮游戏中,该游戏者会选择上一轮游戏中对手所采取的方案。如果其他游戏者选择合作,那么以牙还牙的游戏者也会如此。然而不管什么时候,只要对手选择背叛,以牙还牙的游戏者在下一轮比赛中也会选择背叛。直到对手选择合作之前,他一直会采用背叛这种方式。

  在任意给定游戏次数,并与固定对手对弈的比赛中,使用以牙还牙的策略也许会输。但是如果比赛次数无限多,并与不同的策略对抗时,平均来说,以牙还牙的策略是优于其他策略的。或者至少在艾克斯的比赛中是这样。

  一旦采用以牙还牙的策略者取胜,那么看起来更好的策略似乎是可能发掘的。所以艾克斯又举办了一次比赛,这次有62个人参加,在第二轮的参赛者中,只有一个人使用以牙还牙的策略。他就是拉波波特,而且他又一次赢了。

  你可以明白以牙还牙策略是如何在一个群体中增加合作机会的。作为以牙还牙的游戏者,信誉会促使你的对手与你合作,知道他们这样做后,你也会选择合作。如果他们不合作,你也不合作。

  奈何,如此一来,事情变得更为复杂。仅仅因为以牙还牙的策略赢得艾克斯的比赛,这并不意味着它在现实世界中是最佳策略。首先,在肉搏战中和其他策略相比,它很少能赢;总体来说,它做得很好(因为采用以牙还牙策略击败对手,和其他策略相比,对手也要损失惨重)。

  诺瓦克在会议上,探讨以牙还牙策略在广泛背景下的细微差别,乍看,以牙还牙的成功似乎否定了纳什均衡理论,暗示最佳策略就是一直背叛。进化博弈论的数学基础是分析无限多的群体数量,似乎证实了那种以牙还牙的策略。然而,诺瓦克指出,对于一个现实的有限的群体,在一定的情况下,你可以证明以牙还牙的策略能够成功侵犯所有具有背叛行为的种群。

  但是如果游戏继续,你一直计算下一步会发生什么,这样会变得更复杂。以牙还牙采取的是不原谅策略——如果你的对手本来打算合作,但是由于意外他背叛了你,于是你开始背叛他,并终止合作。如果你能计算出博弈中将会发生什么,那么你会发现以牙还牙策略并不是很成功,而改进后的策略,即宽宏大量的以牙还牙策略则比改进前要好很多。所以宽宏大量的以牙还牙策略被用来管理种群中的事务。

  “宽宏大量的以牙还牙策略以合作开始。无论你什么时候开始合作,我都会采取合作的方式。有时即使你背叛我,我也会和你合作”,诺瓦克补充道。“这允许我们为自己犯下的错误进行改正——如果是不小心犯下的错误,你有机会改正它。”

  诺瓦克说,随着游戏的继续进行,情况变得更让人吃惊。宽宏大量的以牙还牙的方法开始被全部合作的方法代替!“因为如果每个人都采用宽宏大量的以牙还牙的策略,或者以牙还牙策略,那么没有人会故意的试图背叛;即每个人都是合作者。”啊,多么快乐的时光啊!

  “一直合作”不是一个稳定的策略。一旦每个人都合作,那么一直背叛策略就会入侵,就像一头鹰出现在一群鸽子身边,那么鸽子会灭亡。所以你开始选择全部背叛,然后转向以牙还牙,接着是宽宏大量的以牙还牙,接着是合作,然后再全部背叛。“这,”诺瓦克说,“就是人类的战争与和平的理论”。

  第六节 博弈与惩罚

  尽管如此,人类还是会合作。如果间接互惠不是合作的原因,那么什么是呢?后来,一种流行的看法是由于害怕受到惩罚的威胁,所以合作才会兴起。并且博弈论证明了这种情况是如何产生的。

  经济学家萨缪尔·鲍尔斯、赫伯特·金迪斯,以及人类学者罗伯特·博依德是这一观点的倡导者。他们称该观点为“强互惠”。一个强互惠者奖励合作者,同时惩罚背叛者。在这种情况下,一个比较复杂的游戏描述了相互作用。不像玩囚徒困境游戏——一系列的一对一对抗——强互惠博弈研究者在不同的公共利益下进行实验游戏。

  第三章里曾描述过一系列的游戏。在这些游戏中,不同的个体会采取不同的策略——有些是自私者,有些是合作者,还有一些是互惠者。在一个典型的公共利益的游戏中,在开始时给游戏者一些“分”(以后可用真实钱收回)。在每一轮,游戏者可能捐献一些分给社会基金组织,自己留一部分。然后每个人收到一部分的社会基金。然而一个贪婪者为确保自己个人的收益最大化,什么都没捐,整个群体的结果可能更遭。利他主义者为增加整个群体的收益,会把他们自己的一些分给群体。而互惠者基于“他人捐献什么,相应地自己就捐献什么”,惩罚那些捐献很少却贪享整个群体福利的“吝啬鬼”(但是这样做的话,也惩罚了群体中的其他人,包括他们自己)。正如我们已经看到的,人类由三种类型的游戏者组成。进一步的研究表明,为什么人类种族已经演化到包含惩罚者。

  在一个公共利益游戏的测试中,大部分人在一开始就捐献了大约一半的分。然而,在几轮后,捐献逐渐减少。在一个测试中,在第十轮中,将近有3/4的游戏者什么都没捐。显然地,研究者发现,人们对于那些一开始捐献很少的人很生气,为了报复,他们也减少了捐献数额,以此来惩罚每个人。也就是说,大部分游戏者变成互惠者了。

  但是在另一个版本的游戏中,一名研究者公布每一个游戏者的捐献数额,并恳求其他参赛者给予评价。如果捐献少的人会被嘲笑,该吝啬者在后几轮会勉强地慷慨地捐献。如果没有人批评少捐赠者,那么他后面几轮的捐献会更少。显然,羞辱会促使行为发生改善。

  其他的实验证明,非合作者具有被惩罚的危险。所以可能在过去的进化过程中,种群中会包括惩罚者,这样能更多地鼓励合作——而没有实施惩罚的群体被淘汰。惩罚的趋势可能因此在存活的人类种群中根深蒂固,即使惩罚者自己这样做的话也会遭受损失(“根深蒂固”可能不仅仅只在基因中遗传,一些专家认为文化将惩罚的态度延续给下一代)。

  当然,在人类的进化历史中,惩罚的形式可能很不明显。鲍尔斯和金迪斯已经提出惩罚的措施可能主要是放逐,使惩罚者承受相对低的代价却仍然让非合作者承受沉重的代价。他们证明,博弈论的相互作用是如何自然地引导人类社会形成3种类型的人——非合作者(免费乘车者)、合作者和惩罚者(互惠者),正如其他电脑程序模拟所说明的一样。人类种族采取的是混合策略。

  然而专家仍在争论这些问题。我见过一篇文章这样认为:事实上,利他主义通过利他主义者个体的所得利益单独进行发展演化,而并非一定演化自种群的利益。这一结论基于另外一个流行的博弈游戏的模拟结果,这个游戏便是著名的最后通牒游戏,今天,它在由诸如科林·卡麦勒等科学家探索的另一个博弈论的领域——“行为博弈论”得以广泛地运用。行为博弈论专家认为,要深刻理解人类社会行为的深层原因
返回目录 上一页 下一页 回到顶部 0 0
未阅读完?加入书签已便下次继续阅读!
温馨提示: 温看小说的同时发表评论,说出自己的看法和其它小伙伴们分享也不错哦!发表书评还可以获得积分和经验奖励,认真写原创书评 被采纳为精评可以获得大量金币、积分和经验奖励哦!