应用错误收集

如何在文本分类中应用特征选择？

时间：2019-05-20 09:55:04

标签： feature-extraction text-classification feature-selection countvectorizer tfidfvectorizer

我正在使用countVectorizer和朴素贝叶斯对4种方言文本进行分类。验证模型时，准确性降低了。所以我正在寻找如何增加它。我以为可能会过拟合。实现此目的的方法是减少功能部件的数量。我是在max_features=20000功能之前使用45000进行此操作的。 但是：我查看了其余功能，countvectorizer删除了所有重要功能并保留了最常用的功能。但这并不是功能选择。那么如何通过为每种方言选择最相关的特征来进行特征选择呢？

0 个答案:

没有答案

MATLAB中的特征选择方法？
MATLAB中的特征选择
文本分类中的特征选择
文本分类的特征选择
特征选择优先级（Matlab）
何时应用特征选择
斯坦福文本分类器特征选择
如何使用rankfeatures进行特征选择？
如何在文本分类中应用特征选择？

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？