我正在使用一些递归神经网络结构进行多标记分类。我的问题是关于损失函数:我的输出将是真/假(1/0)值的向量,以指示每个标签的类。许多资源表示汉明损失是适当的目标。但是,汉明损失在梯度计算中存在问题: H =平均值(y_true XOR y_pred),XOR无法导出损失的梯度。那么培训多标签分类还有其他损失函数吗?我已尝试使用单个sigmoid输入的MSE和二进制交叉熵。
答案 0 :(得分:4)
H =平均值(y_true *(1-y_pred)+(1-y_true)* y_pred)
是汉明损失的连续近似值。