LibSVM和非数字数据

时间:2010-11-25 17:08:55

标签: machine-learning svm libsvm categorization document-classification

我对使用LibSVM进行文本分类感兴趣。您如何建议我将术语/单词转换为数字数据,以便LibSVM可以理解它?

谢谢!

1 个答案:

答案 0 :(得分:2)

在文本分类中,人们倾向于构建域中使用的单词的直方图,有时他们会查看两个单词的组合并将其放在直方图中(这称为bigrams)。但这实际上取决于您的数据和目标。