对囚徒困境这样的游戏进行分类

2022-02-15 19:57:57

其中一个游戏是《囚徒》';s困境(在这种情况下,策略";Krump";通常被称为";合作";,而";Flitz";通常被称为";缺陷&#)。但是囚犯';s困境有额外的结构。具体来说,要获得PD资格,我们必须有$Y>;W>;Z>;X美元$Y>;如果另一个玩家合作,W$会激发他们叛逃的动机,而$Z>;如果另一个玩家出现缺陷,X$会提供这种动力。在这两个约束条件下,纳什均衡永远是Flitz/Flitz,收益为$(Z,Z)$$W>;Z$正是这种困境的根源;如果改为$Z>;W$,那么这个平衡是一个完美的结果,可能是最优的。

我通常会想到一个囚犯';同时拥有2W美元>;X+Y>;2Z$。这表明,相互合作的总回报最高——它';s";社会最优";从一个有意义的意义上来说——而相互背叛的程度最低。这也意味着你可以为";缺陷";行动如";为自己争取一些价值,但在这个过程中破坏价值";。(或者,";合作";作为";将你的一些价值给予你的玩伴2,在这个过程中增加价值";)我们可以考虑:

如果是2美元<;X+Y$,然后在你的玩伴合作时叛逃创造价值(相对于合作)。从社会角度来看,Krump/Flitz或Flitz/Krump比Krump/Krump更可取;在这种迭代游戏中,你';我更喜欢将$X$替换为$Y$,而不是得到一个恒定的$W$。维基百科仍将其归类为囚犯#39;她进退两难,但我认为';这是一个可疑的术语,我不知道';我不这么认为';这是标准。我可能会不假思索地建议称之为“厨师太多”游戏。(这个名字假设你';宁愿挨饿也不愿做饭,而且变质的肉汤总比没有肉汤好。)

如果$2Z>;X+Y$,然后在你的玩伴缺陷时叛逃创造价值。我认为这是一个囚犯#39;s困境;我的直觉是,对中心案例的大多数分析也适用于此。

据我所知,我们可以根据$W,X,Y,Z$(决定个人结果)和$2W,X+Y,2Z$(决定社会结果)的顺序对游戏进行分类。有时我们';我想考虑两个值相等的情况,但为了简单起见,I和Y 39;假设没有等式,我将对它们进行分类。天真的会有4美元3! = 144美元可能的游戏,但是

颠倒一切事物的顺序并不意味着';不要改变分析,它只是换了Krump和Flitz的标签。因此,我们可以假设,$W>;Z$。这消除了一半的组合。

显然是2W>;2Z$,所以它';这只是一个X+Y美元与它们相比下降了多少的问题。这就消除了另一半。

如果$W>;Z>;•>;•$然后是$X+Y<;2Z$。这就消除了另外四种组合。

如果$•>;•>;W>;Z$then$X+Y>;2W$,再减去四个。

如果$W>;•>;•>;Z$then$2W>;X+Y>;2Z$,淘汰四名。

如果$W>;•>;Z>;•$然后是2W>;X+Y$,消除两个。

如果$•>;W>;•>;Z$then$X+Y>;2Z$,减少两个。

这使我们只剩下20个组合,而我们';我已经看过其中的三个了,所以这看起来很容易理解。在下文中,我';我主要是根据我认为区分这些游戏的有趣程度将它们组合在一起,而我';我没有给他们起名字的时候';我不知道现有的名字。名称和分组都应被视为暂定。

在这个游戏中,你可以吃蛋糕,也可以饿肚子。你喜欢吃蛋糕。你喜欢你的玩伴吃蛋糕。那里';It’每个人都有足够的蛋糕,没有理由挨饿。唯一的纳什均衡是每个人都吃蛋糕,这是社会最优的结果。很棒的比赛!我们应该经常玩。

(如果$X>;Y$,那么如果你必须在你自己和你的玩伴吃蛋糕之间做出选择,你';会自己吃。如果$Y>;X$,那么在那种情况下,你';会给他们。$W,Z$和$X,Y$之间的相等表示在各种情况下对(你自己,你的玩伴)吃蛋糕漠不关心。)

在这个游戏中,你要么去参加派对,要么呆在家里。如果你们都去参加派对,太好了!如果你们都待在家里,那';它也很酷。如果你们中的任何一方去参加派对,而另一方待在家里,你';我俩都会为此感到非常懊恼。

在$W=Z$的情况下,这是一个纯粹的协调游戏,它不';I don’我没有一个不需要沟通就能做出的显而易见的选择。

(维基百科在该页面上称之为保证游戏,但在页面上用这个名字来表示猎鹿,所以我不使用这个名字。)

你可以学习,也可以睡觉。无论你的玩伴做什么,你';如果你们一起学习,你们可以互相帮助。如果你上床睡觉,那么它';如果你的玩伴和你上床,那会更有趣;但如果你刚开始学习,对你来说更好。

你可以猎鹿或野兔(有时是兔子)。如果你们都捕猎牡鹿,你们就可以成功地在你们之间捕捉到一只牡鹿,这很好。如果你们都猎兔,你们每个人都会抓一只兔子,这很好。你可以自己抓一只野兔,但如果你猎杀牡鹿,而你的玩伴猎杀野兔,你将一无所获。

这也适用于$Y=Z$。如果$Y>;Z$然后两个猎兔的人会互相攻击#39;走吧。

纳什均衡是在Stag/Stag和Hare/Hare,Stag/Stag是社会最优的。野兔/野兔可能是最糟糕的社交结果,尽管我认为这个游戏通常用$2Z>;Y+X$。

你可以从公共场所获取一些资源,也可以不去管它。那里';有很多资源可以利用,而你';你最好还是把它拿走。但是如果你和你的玩伴都玩Take游戏,你就可以互相吸引#39;s方式并降低效率(除非$X=W$)。

如果$2W>;X+Y$那么你不';相互影响显著;社会最优结果也是纳什均衡。但如果2W美元<;X+Y$那么干预的总成本超过了你们任何一方可以获取的资源的价值,一些协调一个人获取和一个人离开的方法将具有社会价值。

如果$Y>;Z$如果(无论出于何种原因)你离开了资源,你';我希望你的伴侣能接受。如果$Z>;Y$you';我希望他们也离开。

一个有趣的例子是$X>;W>;Z>;Y$和$X+Y>;2W$。走/走和走/走是社会最优的,但离开的玩家更喜欢任何其他结果。

在这个游戏中,你可以工作(投入帮助建立一个共同的资源)或逃避(不这样做)。如果你们中的任何一方都能工作,那么这对你们双方来说都超出了成本。理想情况下,当你的玩伴工作时,你想逃避;但如果你的玩伴逃避,你';I’我宁愿工作,也不愿把工作留着做。纳什均衡在起作用/逃避和逃避/工作。

如果$2W>;X+Y$那么,社会最佳结果是工作/工作,协调该结果的方法在社会上是有用的。如果是2美元<;X+Y$,社会最佳结果是一方工作,另一方逃避,但没有明显的选择。

在这个游戏中,目标是玩一个不同于你的玩伴的动作。如果$X=Y$,则有';It’没有理由喜欢一个动作而不是另一个,但是如果他们';你在那里不平等';谁能得到什么奖励,就得绕着圈子转。如果你';如果你对结果不满意,那么改变你的动作对你的玩伴的伤害要大于对你的伤害。纳什均衡是当你采取不同的行动时,这些都是社会最优的。

(我有点惊讶,这是唯一一个我想根据结果的社会偏好来重新命名游戏的情况。也就是说,唯一一个$X+Y$不被强迫大于或小于$2X$的游戏是农民的困境和丰富的公共资源,而这些正是我最希望看到的将来分裂。)

我画了一张这些游戏的图表。我只根据$W,X,Y,Z$的顺序对它们进行分类(即我把囚犯和厨师太多的困境归为一类),每当两个游戏相同时,除了交换两个相邻的值外,我都会获得优势。看起来是这样的:

线的颜色根据交换的值对而定(前两个为红色,中间两个为蓝色,后两个为绿色)。我';我不确定我们能从中学到多少,但我觉得对称性令人愉悦。

我不';我现在不想深入研究这个问题,但在这里';这是一个我们可以应用的转变。我们不是用$W,X,Y,Z$来思考这些游戏,而是用";第二名球员在克鲁姆和#34#之间玩弗利茨的价值:

$a=X-W$,如果玩家1玩Krump,则为玩家1的值。

$β=Y-W$,如果玩家1玩Krump,则为玩家2的值。

$γ=Z-Y$,如果玩家1玩Flitz,则为玩家1的值。

$δ=Z-X$,如果玩家1玩Flitz,则为玩家2的值。

这四个数字决定了$W,X,Y,Z$,加上一个常数值,这并不';不要改变游戏。例如,囚犯';s困境和太多厨师都有$a<;0,β>;0,γ<;0,δ>;0$. 一名囚犯';s困境还有$α+β<;0美元,而太多厨师拥有$α+β>;0$.

那么,如果我们开始用$α,β,γ,δ$来考虑这些游戏,会发生什么呢?这能给我们提供有用的见解吗?我不';我不知道。

当然,为了让这些数字指向本文研究的其中一个游戏,我们必须有$α-β=γ-δ$。我认为如果你放松这个限制,你就会开始研究比这些游戏更一般的游戏。但我没有';我没想太多。

称他们为你的";对手";假设对抗程度可能不存在。  ↩

由discus支持的评论