计算机视觉和深度学习文献通常说,对于二元(两类)问题,应使用binary_crossentropy
,对于两类以上的问题,应使用categorical_crossentropy
。现在我想知道:是否有任何理由不将后者用于两类问题?
答案 0 :(得分:0)
categorical_crossentropy
:
binary_crossentropy
:
两类问题可以建模为:
softmax + categorical_crossentropy
sigmoid + binary_crossentropy
说明
请注意,在分类交叉熵(第一个方程式)中,y_true
对于真正的神经元而言仅是1,从而使所有其他神经元等于零。
等式可以简化为:ln(y_pred[correct_label])
。
现在请注意二进制交叉熵(图片中的第二个方程)如何具有两个术语,一个用于将1视为正确的类别,另一个用于将0视为正确的类别。