使用mahout对数据进行分类

时间:2012-12-12 07:18:29

标签: apache hadoop machine-learning mahout

我是Apache Mahout的新手,并致力于解决分类问题。

问题陈述:  文本文件中存在一组数据,我需要根据给定的时间跨度从文件中获取部分或全部数据。

时间跨度:每条记录都有一个交易日期  因此,时间跨度将使用逻辑(Sys_Date - Transaction_Date)计算。

因此,输出会根据上个月/周/特定天数是否需要数据而有所不同  如何使用Apache Mahout实现此过滤。

2 个答案:

答案 0 :(得分:1)

这本身并不像机器学习问题。您希望将数据放入某种数据库并查询日期范围内的记录。然后,您想要对该数据执行某些操作。这不是ML工具所做的事情。

答案 1 :(得分:0)

我还没有和hadoop合作过。但在我看来,这个视频应该有所帮助: http://www.youtube.com/watch?v=KwW7bQRykHI&feature=player_embedded

过滤后,您可以在mahout中使用结果(用于解决分类问题)