LIBSVM是否适合许多类别和样本?

时间:2018-06-26 22:47:11

标签: machine-learning svm libsvm

我正在建立一个文本分类器,它应该能够给出文档属于某些类别的概率(即80%的小说,30%的市场营销等)

我相信Libsvm是通过“预测”方法完成的,但是问题是我有大约20个类别需要测试。另外,我有数百个文档可用于培训。

问题在于训练文件的大小为1 GB-2 GB,这使Libsvc变得非常慢。

该问题如何解决?我应该改为使用Liblinear,还是有更好的选择?

1 个答案:

答案 0 :(得分:0)

关于这个特定的问题,我不得不使用Liblinear,因为LibSVC可以永远运行。

但是,如果有人想知道最终结果如何:

  1. 我从PHP / C ++切换到Python,这非常了不起 更容易,并且没有遇到任何内存问题
  2. 我的案子是“多标签”。 This article使我朝着正确的方向前进,the magpie project帮助我完成了任务。