如何实现一次需要所有输出的成本函数

时间:2018-04-16 12:02:28

标签: tensorflow

假设我有一个成本函数,需要神经网络的所有输出(即在一定范围的训练时间步骤之间)来计算其成本。

这方面的一个例子是网络对未来培训数据的行为会影响成本。例如。网络可能会被训练成在赛道上驾驶模拟赛车,费用是完成时间或崩溃时间。

在tensorflow中实现这个目的的方法是什么?

1 个答案:

答案 0 :(得分:1)

标准方法是使用回归神经网络(序列数据,您可以在一些或所有序列步骤中计算损失函数),或强化学习,在未来某个不确定点只有奖励(例如,在课程结束时,你可以获得更快的奖励。

这是一个关于在张量流中实现RNN的好教程:

https://github.com/aymericdamien/TensorFlow-Examples/blob/master/notebooks/3_NeuralNetworks/dynamic_rnn.ipynb

以下是我发现的强化学习的介绍:

https://medium.com/@curiousily/getting-your-feet-rewarded-deep-reinforcement-learning-for-hackers-part-0-900ca5bb83e5

这些都是您可能用来解决问题的模型类型,具体取决于您希望如何构建问题。 Tensorflow是一个通用的数学库,提供自动区分和GPU支持,您可以在tensorflow之上构建任何这些模型。