标签: machine-learning keras artificial-intelligence data-science reinforcement-learning
我试图使用Keras为时间序列数据构建1Dconvolution模型。但是,在这种情况下,我想使用强化学习方法。这样,我不需要目标数据,因为我使用自定义损失函数来根据前一步的输出计算损失。然后优化器将努力减少自定义损失。
在我的场景中,epochs batch_size等于1,渐变将在每次输入样本后立即反向传播。
问题:Keras中的model.fit()需要输入和目标输出来计算损耗和梯度,如何跳过目标值并输入输入数据并接收输出以传递给我的损失函数?
谢谢