如何使用Mapreduce仅使用Review and Rating数据列分析审阅数据文件

时间:2017-03-06 08:17:49

标签: hadoop mapreduce

我需要提出一个mapreduce代码来生成评论中提到的最常见的产品及其相应的评级,我对Hadoop很新,如果有人能在这方面为我提供帮助,那就太棒了。

以下是我所拥有的数据结构,它有两个字段查看详细信息和评级,产品名称在评论详细信息本身中提及,并且产品名称或ID没有单独的字段。评级也会添加到评论旁边的列中。还需要发出常见的单词,如(the,and,it)等。

{{1}}

0 个答案:

没有答案