如何在Hadoop作业中从DocumentDB获取数据

时间:2015-05-26 18:35:37

标签: hadoop mapreduce azure-cosmosdb

我想知道如何控制数据从DocumentDB获取到映射器的方式?我的意思是有多少JSON文档被赋予映射器等?

1 个答案:

答案 0 :(得分:0)

目前,这些文件是以700个文件批次提取的,这是一个很好的平均值。 您可以设置的最大值是1000个文档,请问您为什么要更改它?

您目前无法将其更改为配置。 如果您自己构建连接器,如果您自己构建连接器,则可以在此处进行更改 github link

如果你有一个很好的用例,你可以在github上打开一个问题,要求能够使用config更改它。