我有一个无法加载的大文件,因此我在xgb.DMatrix
上使用本地文件。但我只想使用其中一部分功能。 xgboost
上的文档说colset
上的slice
参数“当前未使用”,并且在github页面上没有提及此功能。而且我还没有找到有关如何使用外部存储器进行列子集设置的其他线索。
我希望比较使用不同功能子设置生成的模型。我唯一想到的就是创建一个具有我要使用的功能的新文件,但是这需要很长时间,并且会占用大量内存...我不禁要问是否有更好的方法。
ps .:我也尝试使用h2o
软件包,但h2o.importFile
冻结了。