应用错误收集

时间：2012-12-22 00:21:54

标签： c matlab machine-learning gradient-descent

我目前正致力于机器学习算法，我注意到当我使用Matlab的fminunc时，与手动更新参数时相比，算法收敛到全局最小值（几次迭代）：

thetas[j] = thetas[j] - (alpha*gradient)/sampleNum;

我认为这是因为我天真地认为alpha（步比例）是不变的。

那么，如何在C中实现类似fminunc的内容？

我尝试从大alpha开始，如果当前成本大于之前的成本，则调整它。当最小化函数的形状不是线性的时，问题出现了，因为alpha最初会得到一个非常小的值，而当函数形状趋于变得“平坦”（并且更大）时，它不会返回到更大的值。可以采取步骤）。

答案 0 :(得分：3)

Matlab的fminunc实际上并不使用渐变下降，而是使用类似牛顿的方法（BFGS-based quasi-Newton or trust-region，具体取决于问题大小），无论你如何，它通常都比梯度下降快得多选择步长。

如果你想要更快的收敛，也许你应该研究这种方法。