LIBSVM的数据格式

时间:2014-06-10 19:09:00

标签: machine-learning libsvm

我需要知道如何为LIBSVM中的以下示例准备数据格式

我有两个课程,体育和政治

在体育类别中,我有两份文件,内容如下

Doc1:足球世界杯2014年 Doc2:罗纳尔多是最好的足球运动员

在政治类别中有三个文件,内容如下

Doc 1:政治非常糟糕 Doc2:远离政治 Doc3:政治家是游戏玩家

现在从2个类别的上述6个文档中我想知道如何准备LIBSVM的培训文件?

还有一个问题,我可以为每个类别准备两个LIBSVM培训文件,并在LIBSVM.Net中使用。
如果是,那么我如何使用两个培训文件并使用它们?

1 个答案:

答案 0 :(得分:1)

似乎你在混合两个不同的问题:

  1. 如何将文档表示为可以提供给分类器的特征向量
  2. 如何使用特定的库,例如LIBSVM或LIMSVM.NET(我不确定第二个是什么,你的意思是this吗?你应该更具体一点。)
  3. 关于第一个问题,根据任务的不同,有很多可能性。一种可能的简单方法是tf-idf representation

    关于使用这些库,你尝试了什么,以及什么没有用?你看过文件了吗? LIBSVM具有非常丰富且清晰的guide