应用错误收集

我是该领域的新手，我一直在使用sklearn-python的多层感知器进行一些实验。我已经阅读了很多有关激活功能的文章，无论如何我都找不到关于参数alpha的任何真正有用的东西：

MLPClassifier(activation='tanh', alpha=0.001, hidden_layer_sizes=(25, 1),max_iter=2000)

它如何工作？我们为什么用它？背后的理论是什么？我喜欢理解当我处理这种事情时真正发生的事情，我对此感到很好奇。如果有人可以向我解释，我将不胜感激！谢谢你们！