答案 0 :(得分:16)
要了解ReLU等功能如何实现反向传播,您需要了解衍生物最重要的属性,使反向传播算法运行良好。这个属性是:
f(x) ~ f(x0) + f'(x0)(x - x0)
如果您此时将x0
视为参数的实际值 - 您可以告诉(了解成本函数的值及其导数)当您更改参数时成本函数的行为方式一点点。这是反向传播中最重要的事情。
由于计算成本函数对于成本计算至关重要 - 您需要使用成本函数来满足上述属性。除了0
的一个小邻域之外,很容易检查ReLU是否满足这个属性。这是ReLU唯一的问题 - 当我们接近0
时,我们无法使用此属性。
为了克服这个问题,您可以选择0
中的ReLU衍生值来1
或0
。另一方面,大多数研究人员认为这个问题并不严重,因为在ReLU计算过程中接近0
的事实相对较少。
从上面 - 当然 - 从纯粹的数学观点来看,使用ReLU和反向传播算法是不合理的。另一方面 - 在实践中,0.