标签: machine-learning svm libsvm categorization document-classification
我对使用LibSVM进行文本分类感兴趣。您如何建议我将术语/单词转换为数字数据,以便LibSVM可以理解它?
谢谢!
答案 0 :(得分:2)
在文本分类中,人们倾向于构建域中使用的单词的直方图,有时他们会查看两个单词的组合并将其放在直方图中(这称为bigrams)。但这实际上取决于您的数据和目标。