标签: java machine-learning neural-network deep-learning q-learning
我正在尝试用Java从头开始学习足球游戏,我正在尝试使用Google DeepMind的深度Q学习算法实现强化学习(尽管没有卷积网络)。我已经建立了神经网络和Q-learning,现在我正在尝试将它们加在一起,但是在这段代码中我有些不明白。
预处理顺序Φ1=Φ(s1)(第4行)
我无法弄清楚Φ在这个算法中代表什么。
答案 0 :(得分:2)