标签: deep-learning conv-neural-network loss-function
我想知道是否可以用具有损失函数作为激活函数的层替换模型的损失函数。如果是,这将如何影响网络?梯度下降将如何工作?如果执行此操作,如何获得预测?