xgboost及其sklearn的集成feature_importances_错误

时间:2016-03-25 09:03:39

标签: python scikit-learn xgboost

我正在使用sklearn及其feature_importances_的包装器。

每当我尝试打印feature_importances_时,都会出现以下错误:

  

ValueError:具有基数10的int()的无效文字

深入研究代码,我发现get_fscore property正在从原始助推器调用{'feat_name1':5,'feat_name2':8,...,'feat_nameN':1} method带空参数)。此方法显式返回如下形式的字典:

feature_importances_

因此,考虑到int对密钥应用了keys = [int(k.replace('f', '')) for k in fs.keys()] #this is the conflictive line of code 转换,会发现错误消息的理由。

get_fscore

所以,我的问题是双重的:

1- 这是一个错误,因此我应该报告它(甚至修复它并请求拉动)?

2-是否有fmap函数及其$this参数缺少的内容?

1 个答案:

答案 0 :(得分:2)

我建议在XGBoost Github网站上将其报告为错误:https://github.com/dmlc/xgboost/issues