不确定SO是否是提出这个问题的正确位置,但无论如何我都会尝试。
我正在玩神经网络和扑克,我面临的问题是如何评估不同的玩家。我正在谈论的扑克变种是6名玩家的无限制扑克。有没有更好的方法来找出玩家的精确(或至少某种确切的)胜利,而不是模拟X(从数十万到数百万)手牌?问题是模拟数百万只手是有点费时的,因为每次移动都意味着计算神经网络输出。生成所有可能的手和板选项似乎不是一个好主意,因为它们有很多。
有可能做得更好吗?
答案 0 :(得分:0)
摘要:
主要问题是变量的数量:你不仅拥有6张双牌牌和5张连续牌,而且还需要处理5种外国投注策略。除非您知道 all 这些策略的详细信息,否则您无法直接计算概率平均结果。
假设你也有自适应策略,那些改编会给计算增加更多的复杂性,这样一个100手的试验必须考虑所玩手的序列 - 一个“大爆炸”组合爆炸。
因此,我们似乎坚持使用蒙特卡罗方法(例如随机抽样)。尝试一些试验,看看你需要多少来合理评估你的需求。你真的需要10 ^ 6手牌才能做到这一点,或者100或1000手会给你一个很好的近似值?如果您只是想训练和调整模型,我猜测每次100手的20次试验将超过您获得99%准确率的回报率(赢率)。