是否可以从hadoop mongodb插件连接器读取mongodb数据,使用mapreduce hadoop处理数据,当输出结果不使用hadoop mongodb插件连接器但是在hdfs中保留mapreduce hadoop的结果?
答案 0 :(得分:0)
我认为之前关于SO的回答会回答你的问题,只需稍加改动:
Is it possible to read MongoDB data, process it with Hadoop, and output it into a RDBS(MySQL)?
主要区别在于您将OutputFormatClass设置为:
job.setOutputFormatClass( SequenceFileOutputFormat.class );
您还需要在要保存数据的HDFS上设置输出路径。有关完整的代码示例,请参阅他们的WordCount示例,但请使用上面的输出格式代替MongoOutputFormat。