基础盲狙理论 贝叶斯法则在身份推断中的应用

作者:ljzhalcyon 来源:TGBUS整理 发布时间:2015-11-12 17:53

内容摘要:盲狙策略一直是身份局的重要策略之一。如果用博弈论的观点来研究一局三国杀,那么盲狙可以被视为一类策略的总称。那么我们自然想弄清楚什么时候应该盲狙,什么时候不应该。本...

  盲狙策略一直是身份局的重要策略之一。如果用博弈论的观点来研究一局三国杀,那么盲狙可以被视为一类策略的总称。那么我们自然想弄清楚什么时候应该盲狙,什么时候不应该。本篇短文研究的中心问题是:在游戏开始时,主公玩家如何理性推测一个武将的身份。结论表明,一名玩家的身份推测和其选择武将的相对强度有关,和绝对强度几乎无关。本文为系统的盲狙理论打下基础。

  假设1:给定一名玩家的座次(即行动顺位)和身份,一名武将的强度被定义为该玩家选择此武将后此局游戏获胜的概率。每名玩家有3个候选武将,给定座次,任何玩家始终选择3个候选武将中强度最高的武将。

  假设1含有多层意思。

  首先,我们假设对于一个给定座次的玩家,当主公完成选将后,他明确地了解所所有武将此时的胜率。因此,当一个玩家的座次和身份确定后,他可以根据身份和座次,将所有武将的强度由高到低排名。

  例子1:主公选择刘备,那么给定身份(比如忠臣),3号位玩家了解他此时选择任何一个武将后,他赢得此局游戏的概率。比如他知道他若选择关羽,他的胜率为30%。他同样也知道他若选择司马懿,他的胜率为31%。(当然这两个数字是我杜撰的)

  其次,我们假设此排名为公共信息。即场上每名玩家都知道任意座次玩家的武将排名。请注意,由于玩家相互不知道身份,在其余玩家眼中,某座次的玩家有3套排名(反贼排名,忠臣排名,内奸排名)。因此,其它玩家能基于某玩家的选将推断他的身份。当然,公共信息并不是进行身份推断的必要条件。但本文仅讨论此情况。

  我们很自然地提出以下问题:现假设某座次的玩家选择了武将A,那么在游戏开始时,主公如何推断他是反贼的概率?

  根据假设,其余玩家是知道武将A在该玩家忠臣,内奸,反贼中的排名的。为方便,设在反贼排名中,有x名武将排名低于A,在忠臣排名中,有y名武将排名低于A,在内奸排名中,有z名武将排名低于A。设一共有n名武将。定义以下事件:

  A=该座次玩家选择了武将A

  A’=该玩家的选将框里出现了武将A

  B=A|A’

  F=该玩家是反贼。因此Pr(F)=1/2

  Z=该玩家是忠臣。因此Pr(Z)=1/4

  N=该玩家是内奸。因此Pr(F)=1/8

  那么主公认为该玩家为反贼的概率应为P(F|B)(称为后验贝叶斯信念)。我们用贝叶斯法则来计算这个条件概率:

  图

  方程(1)是关键方程,它说明,在主公看来,某座次玩家为反贼的概率仅和比例y(y-1)/(x(x-1))以及z(z-1)/(x(x-1))有关。这个比例即为上文中提到的相对排名。回忆x的定义,不难发现x越高,强度弱于A的武将则越多,所以x即为反贼的倒序排名。同理,y,z分别为忠臣,内奸的倒序排名。基于此,有以下重要命题:

  命题1:在主公看来,某座次玩家为反贼的概率仅和比例y(y-1)/(x(x-1))以及z(z-1)/(x(x-1))有关,比例越大,该玩家为反贼的可能性越低,反之比例越小,该玩家为反贼的可能性越高。

  例子2:考虑x=y=z的情况,即对于某座次的玩家,武将A当反贼,内奸,忠臣的强度相等。那么根据(1)不难算出Pr(F|B)=4/7。这和我们的直觉是相符的。开局后,如果不看大家的选将(基本等价于武将A当反贼,内奸,忠臣的强度相等),那么在主公看来,任一玩家为反贼的概率为4/7,而不是1/2(其余7名玩家中有4名反贼)。典型的例子如袁术,当忠反内都很强,我们从某人选袁术这一情况几乎不能挖掘任何额外信息。因此盲狙袁术是不推荐的。

  例子3:考虑x=y, z=1的情况。即对于某座次玩家,武将A当忠反强度差不多,但当内最弱。典型的例子如荀彧。不难算出Pr(F|B)=2/3>4/7。即在此情况下,该武将是反贼的可能性比4/7要大(这是因为该武将几乎不可能是内奸)。所以盲狙荀彧是有根据的,因为尽管荀彧是神忠,但荀彧也是神反。

  例子4:考虑x3/2时,Pr(F|B)<4/7。即若相比于反贼,步练师当忠足够强,那么盲狙步练师是不推荐的。相反,如果y(y-1)/(x(x-1))<3/2时,Pr(F|B)>4/7,此时盲狙步练师是推荐的。那么y(y-1)/(x(x-1))究竟是大于还是小于3/2呢?根据大家的经验,步练师当反也是很强的,只不过比当忠稍弱而已,因此可以认为y(y-1)/(x(x-1))<3/2。又因为步练师当内实在太弱,因此盲狙步练师几乎是不亏的。

  例子5:考虑x>>y= z的情况。即某武将只适合当反。典型的如曹丕局的满宠,2位春哥。那么此时Pr(F|B)接近于1。即该武将确定是反贼无疑。这和我们的直觉非常相符。为什么主公会盲狙2位黄盖的倾向远大于盲狙2位界黄盖?同样也可以用这个情况来解释。对于黄盖,x>>y= z,但对于界黄盖,x=y>>z。

  本文利用贝叶斯法则建立了基本的身份推断公式。本文对于指导主公的盲狙有非常重要的意义。本文在多个方面可以被拓展。首先,假设1是否可以被放宽,即某玩家是否会在3个候选武将中选择强度不是最强的那个?比如主公的身份推断是否会对其他玩家的选将有反作用?比如内奸选低强度武将避免被盲狙(此时假设1不成立)。其次,本文没有考虑会员选将,换将卡等的影响。再次,玩家在选将时是否不仅仅考虑强度,还会考虑趣味性?最后,反贼概率是否大于4/7应该作为盲狙的唯一标准(比如考虑风险厌恶的效用函数)?这些问题都是值得探讨的。

分享到:
更多 0
观后感:
-官网新闻-
-游戏下载-
-游戏攻略-
-游戏资料-
-游戏攻略-
-疑难解答-
-精彩视频-
-精美图库-
-玩家杂谈-