应用错误收集

如何使用tensorflow.Estimator进行强化学习

时间：2018-03-14 14:42:05

标签： tensorflow tensorflow-estimator

tensorflow.Estimator似乎适应了有监督的学习，但即使模型或培训只需要很小的改动，似乎很难采用其他任务。例如，在强化学习中，我需要提供不属于features的奖励值。

1 个答案:

答案 0 :(得分：2)

估计者是为了进行良好的监督学习。因此，采用它们进行强化学习可能会感到尴尬。这是一个可能有用的RL库：https://github.com/tensorflow/agents。