我想将基于Hadoop的Mahout推荐程序与Apache Hive结合起来。所以我生成的建议书直接存储在我的Hive Tables中。任何人都知道类似的教程吗?
答案 0 :(得分:7)
基于Hadoop的Mahout推荐器可以直接将结果存储在HDFS中。
Hive还允许您使用CREATE EXTERNAL TABLE recommend_table
在任何数据之上创建表架构,LOCATION '/home/admin/userdata';
还指定数据的位置(/home/admin/userdata
)。
通过这种方式,您可以确保在将新数据写入该位置时Table
,然后它可供Hive使用,并且可以通过现有{{1}}架构进行查询:recommended_table。
我曾在一段时间内写过博客:external-tables-in-hive-are-handy。此解决方案有助于为Hive即席查询立即提供任何类型的map-reduce程序输出。