将群集数据从HDFS移动到Hive

时间:2012-07-18 15:50:27

标签: hadoop hive hdfs mahout k-means

我一直在Cloudera演示虚拟机中试验Mahout,并使用以下方法成功整合了样本合成控制数据(https://cwiki.apache.org/MAHOUT/clustering-of-synthetic-control-data.html) k-Means算法。我已经使用了ClusterDumper并且可以查看Mahout输出,但现在我想将输出放入Hive表中。我该怎么做呢?

2 个答案:

答案 0 :(得分:1)

没有直接整合。您最好的办法是修改ClusterDumper以生成某种文本表示形式,并将其作为表格数据导入Hive。

答案 1 :(得分:0)

在Hive中创建一个外部表,这应该指向Mahout o / p路径。