我需要知道如何为LIBSVM中的以下示例准备数据格式
我有两个课程,体育和政治
在体育类别中,我有两份文件,内容如下
Doc1:足球世界杯2014年 Doc2:罗纳尔多是最好的足球运动员
在政治类别中有三个文件,内容如下
Doc 1:政治非常糟糕 Doc2:远离政治 Doc3:政治家是游戏玩家现在从2个类别的上述6个文档中我想知道如何准备LIBSVM的培训文件?
还有一个问题,我可以为每个类别准备两个LIBSVM培训文件,并在LIBSVM.Net中使用。
如果是,那么我如何使用两个培训文件并使用它们?
答案 0 :(得分:1)
似乎你在混合两个不同的问题:
关于第一个问题,根据任务的不同,有很多可能性。一种可能的简单方法是tf-idf representation。
关于使用这些库,你尝试了什么,以及什么没有用?你看过文件了吗? LIBSVM具有非常丰富且清晰的guide。