用于java中文本分类的库

时间:2012-01-29 11:05:27

标签: java machine-learning classification svm

我有一组分类的文本文件。我想对我的研究中使用的另一大组文本文件进行分类。有比较好的方法吗?

我认为基于SVM的方法很有用,但是有一个简单的文档库可以使用这些算法吗?

2 个答案:

答案 0 :(得分:0)

我对SVM知之甚少,但LingPipe可能对您有所帮助。 link是一个专门关于文档分类(自动或引导)的教程。

另外,查看相互关联的搜索产品Lucene(搜索库),Solr(搜索服务器应用程序)和Carrot2(用于“聚类”搜索结果)。在那个空间应该有一些有趣的工作。

答案 1 :(得分:0)

Mallet是另一个令人敬畏的库。一旦您开始将其与系统的其余部分集成,它就有了很好的命令行工具来帮助您入门和使用Java API。