标签: python tf-idf text-classification
我正在研究一个文本分类问题,其中选择了100个最常用的单词作为特征。我相信如果我使用更好的特征选择方法,结果会有所改善吗?有任何想法吗? TF-IDF可以工作吗?如果是,那怎么办?
答案 0 :(得分:0)
改善结果,您可以使用特征选择
1)信息增益
2)Chi square
3)相互信息
4)学期频率
TF-IDF你可以看到这个link它会帮助你