标签: reinforcement-learning
我尝试使用强化学习方法尽快找到局部最小值,哪种RL方法最快可以找到局部最小值?还是与优化程序有关?例如,SGD在寻找局部最小值方面比Adam更快?谢谢。