SVM如何使用文本数据确定边距?

时间:2017-08-09 23:23:22

标签: nlp svm

SVM是一种几何算法,它试图通过在两个类之间绘制超平面来最大化两个类之间的边距。数字作为数据点是可以理解的。但是,我不明白当数据是文本时如何确定边距和超平面?如果有人能举例说明SVM如何处理文本,我将不胜感激。

1 个答案:

答案 0 :(得分:0)

通常在机器学习中,文本输入被转换为文本数据和相应数值的字典。让我们说你的语料库中有3个单词:苹果,橘子,香蕉。字典可能看起来像

苹果:1

橘子:2

香蕉:3

因此,当您获得结果时,将1,2,3传递给模型并将数值转换回文本数据。例如,如果你得到2的结果,那就意味着橘子。