应用错误收集

LIBSVM是否适合许多类别和样本？

时间：2018-06-26 22:47:11

标签： machine-learning svm libsvm

我正在建立一个文本分类器，它应该能够给出文档属于某些类别的概率（即80％的小说，30％的市场营销等）

我相信Libsvm是通过“预测”方法完成的，但是问题是我有大约20个类别需要测试。另外，我有数百个文档可用于培训。

问题在于训练文件的大小为1 GB-2 GB，这使Libsvc变得非常慢。

该问题如何解决？我应该改为使用Liblinear，还是有更好的选择？

1 个答案:

答案 0 :(得分：0)

关于这个特定的问题，我不得不使用Liblinear，因为LibSVC可以永远运行。

但是，如果有人想知道最终结果如何：

我从PHP / C ++切换到Python，这非常了不起更容易，并且没有遇到任何内存问题
我的案子是“多标签”。 This article使我朝着正确的方向前进，the magpie project帮助我完成了任务。