你是否曾对为什么德扑游戏中一些纯诈唬能够奏效感到好奇?
这里所说的纯诈唬是指一个玩家用没有丝毫牌力的牌(哪怕听牌也没有)下注,而他的对手最终放弃一手得体的牌,比如说至少一对。
举例说明
我们来设想下面这样一个场景。
这手牌来自传奇扑克APP盲注5万/10万金币的常规局,有效筹码量为1000万金币。前面玩家弃牌,A玩家在中间位置用Q♥J♥加注到30万,被B玩家在大盲位置跟注。A玩家曾和B玩家对局过,知道他是一个无位置意识的松弱玩家,喜欢游戏大量底池。
翻牌是Q♠8♠5♦,底池现在是65万。
B玩家过牌,A玩家为了让她的顶对得到一些价值下注40万。使她惊讶的是,B玩家做了一个200万金币的巨大加注!
现在轮到A玩家行动,她认为这是B玩家的一种非典型玩法。B玩家没有一手强牌(比如55、Q8同花、好踢脚的顶对或翻前慢玩的高对)很少加注。
当然,B玩家所做巨大加注让A玩家感到困惑。这可能意味着B玩家要么试图迫使她放弃底池,要么他害怕另一张黑桃的发出导致自己的强牌输给一手同花。顺便说一句,A玩家不认为B玩家拿着一副听牌,因为如果他真有一副听牌,他很可能跟注,在投入更多金币到底池之前先等待听牌的完成。
总之,B玩家的加注似乎是两极化的,也就是说,他要么在诈唬要么有一手超强牌。然而,根据A玩家的判断,在这种场合诈唬似乎是不可能的,她决定冷静地放弃她的顶对,等待下一个机会。
事实上,在类似这样的场合她很可能无法准确地抓诈唬。B玩家很可能用他的所有强牌(暗三条、两对等等)做同样的事情。B玩家在这种场合可能拿到比诈唬牌多很多的价值牌,A玩家知道她做出了长期而言正确的决策。这意味着,如果类似的情况在将来发生,她将再次正确地弃牌。
好的,我们再回到之前的问题:
为什么B玩家的大诈唬即使对抗A玩家这样的强手也非常奏效?
答案是,这种诈唬极其少见!
换句话说,B玩家的诈唬是例外,而非常例。如果A玩家注意到B玩家诈唬太多,她将从不放弃自己的牌。A玩家弃牌的唯一原因是因为她知道B玩家在那种场合诈唬不够多!
我们现在做一个快速的数学计算来证实这一点。假设A玩家的假定是正确的,根据她的判断,B玩家可能拿到以下底牌之一:AQ,Q8s(s代表suited,指同样花色),88,55和T2s。
我们来做一次组合分析。鉴于A玩家的底牌已经有一张Q♥,而公共牌是Q♠8♠5♦,剩余的组合应该是:
AQ:8种组合
Q8s:2种组合
88:3种组合
55:3种组合
T2:4种组合
总的说来,A玩家将输给8+2+3+3=16种组合但只打败4种组合。那恰好是4:1。因为我们确定底池赔率是2:1,显然她失败的概率远高于她的回报。数学告诉我们,她应该弃牌!
值得指出的是,A玩家不需要知道B玩家是用什么牌诈唬。她只需要评估B玩家的诈唬频率。因此,只要B玩家用少于8种纯诈唬牌组合诈唬(使失败率与底池赔率2:1匹配的阈值),她应该每次都弃牌!她恰恰是那样做的。
深入探索
从技术上说,以上的4:1比率是不太精确的,因为它没有考虑到A玩家的胜率。事实上,A玩家的底牌对抗B玩家的上述范围约有25%的胜率(equity)。这意味着,她的失败率只有3:1。虽说如此,这也不够精确,因为B玩家可能不会总是让A玩家看到转牌和河牌,让她实现全部胜率(或底池权益)。总而言之,4:1这个比率是对这个局面的一个极好的估算。
顺便说一句,即使A玩家认为B玩家以同样的方式游戏一些较好的听牌,她应该也不会改变弃牌的决定。这是因为那些组合听牌对抗一对有很高的胜率,在某些情况下甚至是占优的。
例如,如果我们把下列底牌加入B玩家的范围:{J♠T♠,J♠9♠,T♠9♠,9♠7♠,7♠6♠,7♠5♠,6♠5♠,6♠4♠,5♠4♠,5♠3♠},A玩家的胜率也只改进到35%,这意味着她顶多不亏不盈,而且得B玩家允许她看完两张剩余牌!
普遍倾向
总之,因为B玩家在类似这样的场合诈唬不够多,A玩家应该弃牌。尽管电视扑克秀上可能有许多神奇的操作,但经验告诉我们,像B玩家这样较少诈唬的人并非例外。相反,他们是传奇扑克APP大部分玩家的典型代表,而且在低级别尤其普遍。
通常说来,玩家们的诈唬频率低于他理论上应该采取的诈唬频率。因此,他们的下注行动平均而言更接近“诚实”(比如说价值牌)而非“不诚实”(比如说诈唬牌)。我们把这种现象称作诚实法则。上述观点的简略版本应该是:
诚实法则:从平均和长远的角度来看,德扑是一种诚实的游戏。
这里的“诚实”是相对“不诚实”而言的,也就是说,下注和加注更接近价值导向(偏重于价值牌)而非诈唬导向(偏重于诈唬牌)。这个法则的另一种等效表述方式是:
诚实法则:总体而言,德扑游戏玩家的诈唬(频率)比他们应该做出的诈唬少很多。
注意:德扑游戏玩家包括每一个玩德扑的个体,从毫无经验的新手到世界上最优秀的玩家。
这里的“应该”是指遵从德扑游戏的博弈论最优策略(简称GTO策略)。GTO策略是一种完全可靠的策略,无论对手如何游戏都保证使用它的玩家得到一个公平的结果。需要注意的是,尽管我们知道GTO策略的存在,但我们并不知道GTO策略是什么。虽说如此,我们可以通过专门研究德扑游戏的某些具体局面得出一个“局部的”近似GTO策略。
我们根据经验可知的是,平均而言人类的诈唬频率远低于他们(根据GTO策略)应该采取的诈唬频率。换句话说,人类的玩法是不平衡的,他们的价值下注多于诈唬下注,而且玩家的经验越少,这种差距就越大。