我是该领域的新手,我一直在使用sklearn-python的多层感知器进行一些实验。我已经阅读了很多有关激活功能的文章,无论如何我都找不到关于参数alpha的任何真正有用的东西:
MLPClassifier(activation='tanh', alpha=0.001, hidden_layer_sizes=(25, 1),max_iter=2000)
它如何工作? 我们为什么用它? 背后的理论是什么? 我喜欢理解当我处理这种事情时真正发生的事情,我对此感到很好奇。 如果有人可以向我解释,我将不胜感激! 谢谢你们!