标签: tensorflow tensorflow-estimator
tensorflow.Estimator似乎适应了有监督的学习,但即使模型或培训只需要很小的改动,似乎很难采用其他任务。例如,在强化学习中,我需要提供不属于features的奖励值。
tensorflow.Estimator
features
答案 0 :(得分:2)
估计者是为了进行良好的监督学习。因此,采用它们进行强化学习可能会感到尴尬。这是一个可能有用的RL库:https://github.com/tensorflow/agents。