应用错误收集

如果你对激活函数g使用步长函数，你是正确的，渐变总是为零（除了0），所以delta规则（也就是梯度下降）什么都不做（{{ 1}}）。这就是阶梯函数感知器不能很好地适应梯度下降的原因。：）

对于线性感知器，dw = 0为g'(x) = 1。

您见过使用dw = alpha * (t_i - y_i) * x_i的代码。我们可以对这里发生的事情进行逆向工程，因为显然dw = alpha * (t_i - y_i) * h_j * x_i，这意味着要记住我们必须拥有g'(h_j) = h_j的微积分。显然，您找到的代码示例使用指数激活函数。

这必须意味着神经元输出被限制在g(x) = e^x + constant上（或者我猜(0, infinity)对于任何有限(a, infinity)，a）。我之前没有遇到过这种情况，但我在网上看到了一些参考资料。对于有界输出（具有已知边界的分类或回归），Logistic或tanh激活更常见。

感知训练 - 三角洲规则

1 个答案: