标签: python scikit-learn
我正在使用scikit-learn训练决策树分类器。
Scikit-learn要求,对于培训,所有数据都应作为
clf.fit(features, ys)
但是,我的功能和y是从几GB的数据文件中加载的,不能一次性加载它们。
有没有办法解决这个问题?
我无法想到一个明显的解决方案,因为决策树依赖于信息增益/熵减少,这需要同时概述所有数据,但我认为有人可能以前遇到过类似的问题。