如何使用tensorflow.Estimator进行强化学习

时间:2018-03-14 14:42:05

标签: tensorflow tensorflow-estimator

tensorflow.Estimator似乎适应了有监督的学习,但即使模型或培训只需要很小的改动,似乎很难采用其他任务。例如,在强化学习中,我需要提供不属于features的奖励值。

1 个答案:

答案 0 :(得分:2)

估计者是为了进行良好的监督学习。因此,采用它们进行强化学习可能会感到尴尬。这是一个可能有用的RL库:https://github.com/tensorflow/agents