SVMlight列车数据格式化

时间:2014-04-23 15:58:17

标签: machine-learning classification svm svmlight reuters

我正在尝试使用svm light对路透社文本进行分类,但我的列车数据不符合格式

  

<'线> 。=。 <'靶> < '特征>:其中' 值GT; < '特征>:其中' 值GT; ...<'feature>:<'value> #<'info>

形式为

  

<'线> 。=。 < '特征>:其中' 值GT; < '特征>:其中' 值GT; ...<'feature>:<'value> #<'info>

目标标签位于单独的文件中。 我知道SVM灯中有一个选项可以让你指定一个单独的目标标签文件,但是我无法在SVM light网站上找到它,因为得到了一条恐怖消息:

  

将示例读入内存...行必须以标签开头或0 !!!

每当我使用

加载我的训练数据时
  

svm_learn example1 / train.dat example1 / model

任何帮助?

1 个答案:

答案 0 :(得分:1)

进行严格的研究我意识到SVM灯中没有语法允许用户为训练数据指定外部类标签文件。类标签必须是训练数据的一部分,它应遵循SVM灯的“目标特征:值”格式