我正在尝试使用svm light对路透社文本进行分类,但我的列车数据不符合格式
<'线> 。=。 <'靶> < '特征>:其中' 值GT; < '特征>:其中' 值GT; ...<'feature>:<'value> #<'info>
形式为
<'线> 。=。 < '特征>:其中' 值GT; < '特征>:其中' 值GT; ...<'feature>:<'value> #<'info>
目标标签位于单独的文件中。 我知道SVM灯中有一个选项可以让你指定一个单独的目标标签文件,但是我无法在SVM light网站上找到它,因为得到了一条恐怖消息:
将示例读入内存...行必须以标签开头或0 !!!
每当我使用
加载我的训练数据时svm_learn example1 / train.dat example1 / model
任何帮助?
答案 0 :(得分:1)
进行严格的研究我意识到SVM灯中没有语法允许用户为训练数据指定外部类标签文件。类标签必须是训练数据的一部分,它应遵循SVM灯的“目标特征:值”格式