如何在Python中将稀疏数据集加载到XGBoost中?

时间:2016-05-20 00:07:24

标签: python machine-learning scikit-learn xgboost

我有一个非常大的具有英文特征名称的稀疏数据集,如下所示。如何将其加载到XGBoost中以训练模型?

根据我迄今为止的尝试,XGBoost只能接受数字特征名称。有没有什么方法可以让XGBoost接受英文功能名称,训练模型然后让我能够通过名字查看功能的重要性?我总是可以创建一个功能名称的地图来识别这个问题,但是我想知道是否有一个更简单的出路?

数据集

1 age:21 weight:56
1 age:32
0 height:46 age:44
0 weight:36 height:99

0 个答案:

没有答案