标签: java machine-learning classification svm
我有一组分类的文本文件。我想对我的研究中使用的另一大组文本文件进行分类。有比较好的方法吗?
我认为基于SVM的方法很有用,但是有一个简单的文档库可以使用这些算法吗?
答案 0 :(得分:0)
我对SVM知之甚少,但LingPipe可能对您有所帮助。 link是一个专门关于文档分类(自动或引导)的教程。
另外,查看相互关联的搜索产品Lucene(搜索库),Solr(搜索服务器应用程序)和Carrot2(用于“聚类”搜索结果)。在那个空间应该有一些有趣的工作。
答案 1 :(得分:0)
Mallet是另一个令人敬畏的库。一旦您开始将其与系统的其余部分集成,它就有了很好的命令行工具来帮助您入门和使用Java API。