标签: reinforcement-learning
我不是英语母语人士。我觉得决斗意味着两个家伙之间的斗争。但是决斗DQN只是将Q(s,a)分解为V(s)+ A(s,a)。我认为这里没有任何战斗。那么这个词到底是什么意思?