因此,我正在编写一个程序,其中我确定了约55个特征的特征重要性,并且其中一些是分类的,因此我对其进行了一次热编码,这样我的数据分析才有意义。我现在正在尝试将一键编码的特征重新整合到其原始特征中,这样我就可以获得每个分类特征的总体重要性。
这是我的伪代码:
Importance = [.1,.2,.3,.4]
Importance_labels = ['Sand_trap_10', 'Sand_trap_15', 'Sand_trap_20', 'Sand_trap_25']
Importances_df = pd.DataFrame({'Importance_labels':'Importance'})
我想要
Importance = [1]
Importance_ labels = ['Sand_trap']
Importance_df = pd.DataFrame({'Importance_labels':'Importance'})
似乎这是解决此问题的一种蛮力方式,但是我在从循环加载新列表并将它们添加到具有所有功能重要性的数据框中时遇到了麻烦。此循环返回两个列表,一个列表中填充了新的重要性值,另一个列表中填充了相应的功能标签。有任何想法吗?排序也不起作用。