应用错误收集

评估不同的扑克策略

时间：2018-03-16 18:17:17

标签： algorithm neural-network brute-force poker

不确定SO是否是提出这个问题的正确位置，但无论如何我都会尝试。

我正在玩神经网络和扑克，我面临的问题是如何评估不同的玩家。我正在谈论的扑克变种是6名玩家的无限制扑克。有没有更好的方法来找出玩家的精确（或至少某种确切的）胜利，而不是模拟X（从数十万到数百万）手牌？问题是模拟数百万只手是有点费时的，因为每次移动都意味着计算神经网络输出。生成所有可能的手和板选项似乎不是一个好主意，因为它们有很多。

有可能做得更好吗？

1 个答案:

答案 0 :(得分：0)

摘要：

没有方式您希望直接计算此指标。
您将无法使用当前计算能力模拟所有可能的牌。

主要问题是变量的数量：你不仅拥有6张双牌牌和5张连续牌，而且还需要处理5种外国投注策略。除非您知道 all 这些策略的详细信息，否则您无法直接计算概率平均结果。

假设你也有自适应策略，那些改编会给计算增加更多的复杂性，这样一个100手的试验必须考虑所玩手的序列 - 一个“大爆炸”组合爆炸。

因此，我们似乎坚持使用蒙特卡罗方法（例如随机抽样）。尝试一些试验，看看你需要多少来合理评估你的需求。你真的需要10 ^ 6手牌才能做到这一点，或者100或1000手会给你一个很好的近似值？如果您只是想训练和调整模型，我猜测每次100手的20次试验将超过您获得99％准确率的回报率（赢率）。