Mongo Bulk使用Hadoop Map Reduce编写

时间:2017-12-11 09:43:33

标签: java mongodb hadoop mapreduce bulkupdate

这些是我的步骤:

  1. 我必须包含S3的JSON文件。
  2. 文件包含uid,ag,gn,yob,scrtp属性。
  3. 我必须将密钥作为uid和value作为ag,gn,yob,scrtp值,并且它包含在HashMap集合中。
  4. 减速器会根据钥匙减少它。哈希值也可以基于密钥计算,因为我在MongoDB中有5个数据库。
  5. 我希望根据哈希值将结果写入5个Mongo数据库,写入应该是批量写入。如何实现上述步骤?

0 个答案:

没有答案