并非所有游戏:将博弈论付诸实践-第1部分

2021年2月24日00:06:32 发表评论 26 次浏览

博弈论是应用数学领域一个鲜为人知的领域, 它有一个不幸的双重名字:"游戏"看似表明它是关于玩物, 而"理论"则表明象牙塔超然。这太糟糕了, 因为该领域有很多东西可以提供给我们这些对商业环境中的协作感兴趣的人。在这里, 我们将仅简要讨论该理论, 然后跳入到业务环境的应用程序中, 包括Web 2.0应用程序:请参阅维基百科如果你有兴趣, 请提供更多有关理论的背景知识。

博弈论的经典"博弈"被称为囚徒困境。再次,

维基百科

提供了简洁明了的描述:

两名犯罪嫌疑人A和B被警方逮捕。警察没有足够的证据定罪, 并且已经将两名囚犯分开, 探视了他们中的每一个以提供相同的待遇:如果一个人作证对另一个人的起诉, 而另一个人保持沉默, 则背叛者获释, 而沉默的同伙收到完整的10年徒刑。如果两个人都保持沉默, 那么这两个囚犯仅会被判处六个月的徒刑, 并需支付少量费用。如果每个人背叛对方, 则每个人将被判五年徒刑。每个囚犯必须选择是背叛对方还是保持沉默。但是, 两个囚犯都不确定要确定另一个囚犯会做出什么选择。因此, 这个难题提出了一个问题:囚犯应该如何行动?

困境是, 从单个囚犯的角度来看, 唯一的理性选择就是背叛另一个。为什么?因为如果另一个人出卖我, 我也会更好地背叛(我会把我的刑期从10年减为5年。)如果另一个人没有出卖我, 那么我还是会更好地摆脱背叛, 因为那我会减少我的刑期从六个月到零个月!不幸的是, 两个囚犯都是这样认为的(只是"理性的"), 所以我们没有闭口不住并被判6个月徒刑, 我们最终都背叛了对方, 因此被判5年徒刑。因此, 似乎理性使我们误入歧途, 因此陷入了困境。

当罗伯特·阿克塞尔罗德(Robert Axelrod)询问囚徒困境中的各种玩家在重复游戏中多次执行其"战略"时会发生什么变化, 结果会有所不同吗?换句话说, 在上面概述的囚徒困境中, 这是一次性的交易。但是, 存在囚徒困境的形式, 在其中发生重复的游戏或迭代。这更像是现实生活, 我们现在和将来都与人们互动, 而我们当前的行为受到我们认为人们将来以及现在所做的事情的影响。有关完整的概述, 请参阅他的书合作的演变。 Axelrod举行了一场计算机竞赛, 人们在其中参加了自己的策略, 而这些策略在锦标赛中相互竞争。 (策略的一个示例:进行合作(不要出卖), 直到对方同意为止, 然后不再合作。另一示例策略:交替合作和不合作, 不考虑对方的所作所为)。获胜的策略非常简单, 被称为TIT-for-TAT:先采取行动, 然后再做其他人在先前采取的行动。因此, 如果其他人一直合作, 那么TIT-for-TAT也将如此。如果对方在大多数时间都进行合作, 那么TIT-for-TAT仅在对方不合作时才不合作, 然后与对方一起恢复合作。

好的-关于理论和人为的"游戏"已经足够了。可以说, 很多聪明人已经利用博弈论(囚犯困境只是可能的博弈类型的特定子集)对许多系统进行了建模, 包括核军备竞赛, 生物系统和经济学。 Axelrod能够在他的计算机模拟中尝试许多不同的因素, 例如未来的相对重要性, 互动的数量等, 并且由此得出了关于如何培育合作或协作环境的一些有趣的结论。我们将在本文结尾列出他的结论, 然后在我的下一篇文章中讨论一些应用程序。

1)扩大未来的阴影-使未来的互动更加频繁, 可能和重要

2)改变收益-激励人们更多地重视合作而不是不合作。

3)教人互相关心

4)互惠互利

5)提高识别能力

链接到原始帖子

一盏木

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: