在讨论神经网络时,我对使用术语线性/非线性感到困惑。任何人都可以为我澄清这三点:
- 神经网络中的每个节点都是输入的加权和。这是输入的线性组合。因此,每个节点的值(忽略激活)由一些线性函数给出。我听说神经网络是通用函数逼近器。这是否意味着,尽管每个节点中包含线性函数,但总网络也能够逼近非线性函数?有没有明确的例子说明这在实践中如何运作?
- 激活函数应用于该节点的输出,以压缩/转换输出,以便通过网络的其余部分进一步传播。我是否正确地将激活函数的输出解释为该节点的“强度”?
- 激活功能也称为非线性功能。非线性一词来自哪里?因为激活的输入是输入到节点的线性组合的结果。我假设它指的是像sigmoid函数这样的东西是非线性函数?为什么激活是非线性的呢?
醇>