sklearn SGDClassifier fit()vs partial_fit()

时间:2016-11-18 18:03:22

标签: machine-learning scikit-learn logistic-regression sklearn-pandas

我对fit()的{​​{1}}和partial_fit()方法感到困惑。文档对两者都说,“适合线性模型与随机梯度下降。”。

我对随机梯度下降的了解是,它需要一个(或一小部分整体)训练示例来在一次迭代中更新模型的参数。并且梯度下降使用每次迭代中的整个数据集。我想用逻辑回归训练模型。我想实现正常的梯度下降和随机梯度下降,并比较它们所需的时间。如何使用SGDClassifier执行此操作? SGDClassifier方法是否像普通梯度下降一样工作?

1 个答案:

答案 0 :(得分:3)

我认为partial_fit方法对于更新已经训练的模型很有用,而fit方法将从头开始重新训练模型。

至于手动选择每个权重更新中包含多少数据,我似乎无法在SGDClassifier documentation中找到相关的参数。