标签: python lstm
我正在建立一个引用论文“ AR_MDN”的模型。
https://arxiv.org/abs/1803.03800
我想知道为什么我总是得到负损失值?
每一步都有MDN丢失吗?
我的意思是,如果LSTM中有10个步骤,我是否应该在不同的fc图层上获取10次均值,方差和alpha值?
我不明白纸上的内容。