我一直在Cloudera演示虚拟机中试验Mahout,并使用以下方法成功整合了样本合成控制数据(https://cwiki.apache.org/MAHOUT/clustering-of-synthetic-control-data.html) k-Means算法。我已经使用了ClusterDumper并且可以查看Mahout输出,但现在我想将输出放入Hive表中。我该怎么做呢?
答案 0 :(得分:1)
没有直接整合。您最好的办法是修改ClusterDumper以生成某种文本表示形式,并将其作为表格数据导入Hive。
答案 1 :(得分:0)
在Hive中创建一个外部表,这应该指向Mahout o / p路径。