如何从DocumentDB中的多个集合中获取数据到Hadoop

时间:2015-06-05 19:36:05

标签: hadoop mapreduce azure-cosmosdb

我有一个hadoop工作,从多个DocumentDB集合中获取数据。在使用DocumentDB配置连接时,我可以使用以下命令设置INOUT_COLLECTION_NAMES

 conf.set(ConfigurationUtil.INPUT_COLLECTION_NAMES, inputCollName);

我的问题是如果我不仅仅有一个收藏品怎么办?如果我不知道我提前收藏了多少收藏品怎么办?

1 个答案:

答案 0 :(得分:0)

请查看here。希望它符合您的要求。我认为hadoop最适合批量处理,这意味着事情不是动态的。快乐的编码