hadoop mongodb连接器 - 输出数据不是mongodb而是hdfs

时间:2012-04-01 15:45:53

标签: mongodb hadoop hadoop-plugins

是否可以从hadoop mongodb插件连接器读取mongodb数据,使用mapreduce hadoop处理数据,当输出结果不使用hadoop mongodb插件连接器但是在hdfs中保留mapreduce hadoop的结果?

1 个答案:

答案 0 :(得分:0)

我认为之前关于SO的回答会回答你的问题,只需稍加改动:

Is it possible to read MongoDB data, process it with Hadoop, and output it into a RDBS(MySQL)?

主要区别在于您将OutputFormatClass设置为:

job.setOutputFormatClass( SequenceFileOutputFormat.class );

您还需要在要保存数据的HDFS上设置输出路径。有关完整的代码示例,请参阅他们的WordCount示例,但请使用上面的输出格式代替MongoOutputFormat。