我正在建立一个文本分类器,它应该能够给出文档属于某些类别的概率(即80%的小说,30%的市场营销等)
我相信Libsvm是通过“预测”方法完成的,但是问题是我有大约20个类别需要测试。另外,我有数百个文档可用于培训。
问题在于训练文件的大小为1 GB-2 GB,这使Libsvc变得非常慢。
该问题如何解决?我应该改为使用Liblinear,还是有更好的选择?
答案 0 :(得分:0)
关于这个特定的问题,我不得不使用Liblinear,因为LibSVC可以永远运行。
但是,如果有人想知道最终结果如何: