SciKit学习大数据的训练分类器

时间:2018-02-16 12:33:03

标签: python scikit-learn

我正在使用scikit-learn训练决策树分类器。

Scikit-learn要求,对于培训,所有数据都应作为

加载和提供
clf.fit(features, ys)

但是,我的功能和y是从几GB的数据文件中加载的,不能一次性加载它们。

有没有办法解决这个问题?

我无法想到一个明显的解决方案,因为决策树依赖于信息增益/熵减少,这需要同时概述所有数据,但我认为有人可能以前遇到过类似的问题。

0 个答案:

没有答案