Azure搜索json blob索引速度

时间:2017-04-25 15:17:53

标签: azure azure-search

当使用天蓝色搜索索引器将json blobs从存储容器中拉入一个简单的索引时,我的吞吐量达到约1000个文档/分钟(在标准层上)。分区数无效。这是围绕我应该期望的每个blob存储索引器吗?

我需要更快的吞吐量,所以我应该考虑滚动自己的索引器并通过其余的api批量调用吗?

1 个答案:

答案 0 :(得分:1)

要确认一下,您使用的是"parsingMode": "json"配置吗? 如果是这样,您可以通过增加索引器批量大小来显着提高性能。默认批量大小为10,如果文档很小,则过低;尝试将其增加到1000(允许的最大值)。您可以使用.NET SDKREST API(搜索batchSize)以编程方式增加Azure门户(编辑索引器刀片)中的批量大小。

如果性能仍然不能满足您的要求,您通常可以通过对输入数据进行分区并创建多个数据源/索引器对来增加索引器吞吐量,所有数据源/索引器对都写入相同的目标搜索索引(服务将多个分区真正在这种情况下很方便)。

当然,您仍然可以使用push API来完全控制索引请求的计时和批处理。