应用错误收集

我正在尝试创建一个模仿我的游戏行为的机器人。游戏是实时的。我可以访问游戏的内部状态。玩家可以执行一系列操作。

基于游戏状态实现if / then决策树机器人很容易，但它不会产生真实的人类玩家。

我虽然使用机器学习和神经网络可以解决这个问题。我最初的方法是每100毫秒记录游戏的状态和行动。我将一系列游戏状态和我的行动输入LSTM，并试图预测在接下来的100毫秒内应该采取什么行动。这个问题是95％以上的时间，我（玩家）闲置并且没有向游戏发送任何输入。因此，训练的结果是网络预测一系列游戏状态之后的下一个动作应该是空闲的。

我想过使用一种不同的方法，只有在玩家发送输入时才会记录游戏状态。这样网络就无法预测玩家应该闲置。当玩家没有发送输入时，这会错过游戏状态中的潜在重要信息。

有关如何处理此事的任何想法？

在视频游戏中模拟人类行为

1 个答案: