Mahout Naive Bayes CSV分类

时间:2014-05-01 16:04:01

标签: java csv mahout document-classification

我有这2个CSV文件:

  1. 列车set.csv
  2. 测试set.csv
  3. 它们都具有相同的结构(具有不同的内容)并且与此示例类似:

    enter image description here

    每个列都是一个要素,最后一列 - class是要预测的类的名称。

    任何人都可以提供以下示例代码:

    1. 使用CSV文件初始化Naive Bayes(模型创建,培训,所需的预处理等......)
    2. 对于给定的CSV行 - 预测班级
    3. 谢谢!

      BTW -

      我正在使用Mahout 0.9Hadoop 2.4,而且我们已经尝试过这些链接:

      http://web.archiveorange.com/archive/v/y0uRZw9Q4iHdjrm4Rfsu http://chimpler.wordpress.com/2013/03/13/using-the-mahout-naive-bayes-classifier-to-automatically-classify-twitter-messages/

1 个答案:

答案 0 :(得分:1)

我管理创建一个工作示例。

如果您有兴趣,请参阅this gist