标签: python machine-learning scikit-learn xgboost
我有一个非常大的具有英文特征名称的稀疏数据集,如下所示。如何将其加载到XGBoost中以训练模型?
根据我迄今为止的尝试,XGBoost只能接受数字特征名称。有没有什么方法可以让XGBoost接受英文功能名称,训练模型然后让我能够通过名字查看功能的重要性?我总是可以创建一个功能名称的地图来识别这个问题,但是我想知道是否有一个更简单的出路?
数据集
1 age:21 weight:56 1 age:32 0 height:46 age:44 0 weight:36 height:99