标签: python xgboost
使用xgboost可以定义子采样率,以便每次迭代使用一定百分比的数据。但是,是否可以指定应该使用的确切子集?我可以想到使用xgboost执行此操作的唯一方法是自己管理迭代过程,如https://github.com/dmlc/xgboost/blob/master/demo/guide-python/boost_from_prediction.py中所示。并且每次迭代都指定不同的dtrain(dtrain每次都会包含一个特定的子样本。)
dtrain
有更优雅的方法吗?