应用错误收集

如何根据要素选择浏览选择分类要素

时间：2014-07-29 16:35:21

标签： python scikit-learn feature-selection

我的问题是我希望使用几个分类变量对数据进行特征选择。我在get_dummies中使用pandas来生成这些分类变量的所有稀疏矩阵。我的问题是sklearn如何知道一个特定的稀疏矩阵实际上属于一个特征并选择/删除所有特征？例如，我有一个名为city的变量。纽约，芝加哥和波士顿有三个级别用于该变量，因此稀疏矩阵看起来像：

[1,0,0] [0,1,0] [0,0,1] 我如何告知sklearn，这三个“列”实际上属于一个特征，即城市，最终不会选择纽约，并删除芝加哥和波士顿？

非常感谢你！

1 个答案:

答案 0 :(得分：5)

你不能。 scikit-learn中的特征选择例程将彼此独立地考虑虚拟变量。这意味着他们可以修剪＆＃34;分类变量的域到低于预测的重要值。

sklearn单变量特征选择
sklearn随机森林可以直接处理分类功能？
sklearn：在基于L1的特征选择后获取特征名称
如何根据要素选择浏览选择分类要素
sklearn中分类数据的递归特征消除？
如何在sklearn中编码分类特征？
Sklearn特征选择
Sklearn MLP特征选择
二进制数据集上的特征选择（分类）
多个类别特征（列）上的特征哈希

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？