使用mahout构建文本分类器

时间:2012-10-15 18:34:56

标签: mahout

我想构建文本分类器,其中类别将由文本确定。

我应该使用哪种分类器?

我一直在读关于mahout的事。 mahout足够了吗?我有大约1Mil文件要训练。

我找不到更好的mahout分类器示例/教程。

mahout是否有我提出请求的http服务器,而it1会给我回复?

如果不是如何在我的网络应用程序(PHP)中嵌入mahout

请建议一些关于mahout的好教程..

2 个答案:

答案 0 :(得分:2)

您的数据似乎没有标记,因此我相信您正在研究群集问题。

我强烈建议您从Mahout in Action本书开始。该书涵盖了建议书,聚类和分类。它应该包含您开始使用所需的所有信息。

答案 1 :(得分:1)

NaiveBayesClassifier

Mahout没有嵌入http服务器,你必须自己构建。 PHP只能将服务作为http客户端请求。

Mahout中有任何演示实现,但它不是基于http。

祝你好运!