Sklearn Fit模型多次

时间:2016-08-11 11:03:56

标签: python scikit-learn

问题的根源很常见:

存在大量的列车数据,这些数据是以块的形式读取的。兴趣点是按顺序拟合分块数据集上的所需模型,保持先前拟合的状态。

除了partial_fit()之外,是否有任何方法可以在不同的数据上使用sklearn来拟合模型?或者是否有任何技巧来重写fit()函数的代码来为这个问题定制它?或者是否有可能通过pickle来实现?

1 个答案:

答案 0 :(得分:6)

有些模型揭露Traceback (most recent call last): File "File.py", line 6, in <module> thelabel = Label(root, Text=t) File "/user/lib/python2.7/lib-tk/Tkinter.py", line 2590, in __init__ Widget.__init__(self, master, 'label', cnf, kw) File "/user/lib/python2.7/lib-tk/Tkinter.py", line 2089, in __init__ (widgetName, self._w) + extra + self._options(cnf)) tkinter.TclError: unknown option "-Text" 而其他模型没有公开的原因。每个模型都是一种不同的机器学习算法,对于其中许多算法,如果不从头开始重新计算模型,就无法添加元素。

因此,如果必须逐步拟合模型,请选择具有partial_fit()的增量模型。您可以在this documentation page找到完整列表。

或者,您可以构建一个集合模型。为您拥有的每个数据块创建单独的partial_fit()Classifier()。然后,当你需要预测某些事情时,你可以

Regression()

或者,对于回归者

for classifier in classifiers:
  votes[classifier.predict(X)] += 1
prediction = numpy.argmax(votes)