外部存储器上的功能子集

时间:2019-05-06 20:47:06

标签: r large-data xgboost

我有一个无法加载的大文件,因此我在xgb.DMatrix上使用本地文件。但我只想使用其中一部分功能。 xgboost上的文档说colset上的slice参数“当前未使用”,并且在github页面上没有提及此功能。而且我还没有找到有关如何使用外部存储器进行列子集设置的其他线索。

我希望比较使用不同功能子设置生成的模型。我唯一想到的就是创建一个具有我要使用的功能的新文件,但是这需要很长时间,并且会占用大量内存...我不禁要问是否有更好的方法。

ps .:我也尝试使用h2o软件包,但h2o.importFile冻结了。

0 个答案:

没有答案