1)如何在weka中应用LSI等特征减少方法进行文本分类?
2)应用像LSI等特征减少方法可以提高分类的准确性吗?
答案 0 :(得分:2)
查看FilteredClassifier课程或AttributeSelectedClassifier。使用FilteredClassifier,您可以使用主要组件分析(PCA)等功能减少方法。以下是video如何使用PCA过滤数据集,以便您可以在简化数据集上尝试不同的分类器。
它可以提供帮助,但不能保证。如果删除冗余功能,或以某种方式转换功能(如SVM或PCA),分类任务可以变得更简单。无论如何,大量的功能通常会导致curse of dimensionality,属性选择是一种避免它的方法。