打了一辈子德州,居然输给了新手AI!(下篇)
打了一辈子德州,居然输给了新手AI!(上篇):https://www.moshike.com/a/347.html
此时,对B而言,就是一个不完美博弈,他无法从A选择play从而判断A手中的硬币是正面还是反面。
这时有两个极限情况,如果B总是猜正面,那么聪明的A就会变化策略,当他抛到正面时就卖掉硬币,如果抛到反面才玩游戏,这样B必然会输。此时,A的期望分数为
0.5(抛到正面的概率)*0.5(选择sell的得分)+0.5(抛到反面的概率)*1(选择play的得分)=0.75
如果B总是猜反面,那么A抛到正面时就会选择play,得一元;抛到反面就会选择sell卖掉硬币,这样只赔五毛钱。所以A的期望是
0.5(抛到正面的概率)*1(选择play的得分)+0.5(抛到反面的概率)*(-0.5)(选择sell的得分)=0.25
此时,出现一个知识点,叫纳什均衡,也就是B为了有效的降低损失,他最有效的策略就是以0.25的概率猜正面,以0.75的概率猜反面,这样可以确保他的胜算最大。
而博弈永远是一个动态的过程,如果B持续按照固有的策略做决策,那么A也会根据B的决策结果调整自己的策略。所以,对B最安全的方法,就是不断更新A卖掉硬币会得到的回报,持续寻找最优解。
我们聪明的计算机就是通过这样的方法动态的计算牌友们押注所带来的回报期望,进而“持续更新对手的套路”,最终获得了「比赛过程中,人类选手整体上从未领先过」的效果。
看来,想要和AI斗智,人类的小脑筋maybe还需要转的更快才行嘞,也许没有套路才是最大的套路哦。
都说金融大佬都爱玩德州,看完这篇文章,金融大佬们是否有些启发呢?
FAQ
德州扑克在中国违法吗?
在中国,德州扑克被列为违法赌博,且无中国国家体育总局的批准,不是中国认可的竞技类棋牌运动。
微撲克軟件下載安裝後無法打開或閃退,怎麼辦?
微撲克軟件下載安裝後無法打開或閃退,怎麼辦? 您只需先卸載已安裝的微撲克app,在微撲克下載頁面安裝即可解決。 微撲克普通版 :應用下載安裝後,在
德州扑克什么情况平分?
《Zynga德州扑克》中会定期出现平分底池的情况。 在德州扑克中,玩家可以使用手牌中的任意牌与(或)台面上的公共牌进行任意组合,从而组成最大的
德州扑克什么位置最好?
BTN(庄家按钮位) 指的是每回合可以最后采取行动的位置,被认为是最佳位置。 在许多情况下,这个位置的玩家前面都会放置一枚写着DEALER 字样的
德州第一张牌发给谁?
荷官庄家位置的确定 座位决定之后,接下来决定荷官庄家位。 第一个按钮庄家的位置是荷官(发牌的人)将牌一张一张地分发给玩家,拿到最强牌的人确定为庄