应用错误收集

为了充分发挥其功能，神经网络需要连续的，不同的激活功能。阈值处理不是多层神经网络的好选择。 Sigmoid是非常通用的功能，可以应用于大多数情况。当您进行二进制分类（0/1值）时，最常见的方法是定义一个输出神经元，如果输出大于阈值，则只需选择一个类1（通常0.5）。

修改

当您使用非常简单的数据（两个输入维度和两个输出类别）时，它似乎是实际放弃神经网络并从数据可视化开始的最佳选择。可以在平面上简单地绘制2d数据（对于不同的类具有不同的颜色）。完成后，您可以调查将一个类与另一个类分开的难度。如果数据位于路中，那么您可以简单地将它们分开 - 线性支持向量机将是更好的选择（因为它将保证一个全局最优）。如果数据看起来真的很复杂，并且决策边界必须是一些曲线（甚至是一组曲线），我建议使用RBF SVM，或者至少是神经网络的正规化形式（因此它的训练至少是可重复的）。如果您决定使用神经网络 - 情况非常相似 - 如果数据只是在平面上分离 - 您可以使用简单（线性/阈值）激活函数。如果它不是线性可分的 - 使用sigmoid或双曲正切，这将确保决策边界的非线性。

<强>更新

过去两年发生了很多变化。特别是（正如评论中所建议的那样，@ Ulysee）对于“几乎无处不在”的各种功能越来越感兴趣，例如ReLU。这些函数在其大部分领域都有有效的导数，因此我们在这一点上需要推导的概率为零。因此，我们仍然可以使用经典方法，并且为了完整性，如果我们需要计算ReLU'(0)，则将零导数放在一起。 ReLU也有完全可微分的近似值，例如softplus函数

神经网络的激活函数

2 个答案: