如何将XGBoost预测映射到相应的数据行?

时间:2016-05-26 00:18:47

标签: python machine-learning xgboost

XGBoost生成测试数据集的预测列表。我的问题是如何将生成的预测映射到实际的测试文件行?假设第n个预测对应于第n个数据行,是否严格安全? XGBoost利用多线程进行操作。那么,在这样的设置中,可以确信预测结果严格映射到测试数据行吗?如果有一种方法用测试数据文件中的某些行标识符来注释预测,那么理想情况下会非常喜欢吗?

我正在使用此示例并使用XGBoost的DMatrix数据格式。 https://github.com/dmlc/xgboost/tree/master/demo/binary_classification

1 个答案:

答案 0 :(得分:0)

我不确定严格安全,但根据我的经验,这种假设是有效的。此外,对于使用xgboost的大多数代码片段,我在Kaggle比赛like this one上看到过,人们做出同样的假设并且它有效。简而言之,您可以放心,它可以工作,但是,我还没有深入研究文档,所以我不能说它一直有效。