标签: reinforcement-learning
Q函数是动作值函数的同义词吗?我看到它可以互换使用,也可以一起使用(例如“ Q动作值函数”)。
答案 0 :(得分:2)
是的,Q函数是用于逼近Q值的术语,与作用值函数相同。 换句话说,当函数逼近用于获取任意状态作用的Q值时,该函数称为Q函数。