我见过的大多数例子都是在最后一层实现softmax。但我读到Keras categorical_crossentropy
会在最后一层之后自动应用softmax,因此这样做是多余的,会导致性能下降。谁是对的?
答案 0 :(得分:5)
默认情况下,Keras categorical_crossentropy不会将softmax应用于输出(请参阅categorical_crossentropy implementation和Tensorflow backend call)。但是,如果直接使用后端功能,则可以选择设置from_logits=True
。