应用错误收集

Azure搜索json blob索引速度

时间：2017-04-25 15:17:53

标签： azure azure-search

当使用天蓝色搜索索引器将json blobs从存储容器中拉入一个简单的索引时，我的吞吐量达到约1000个文档/分钟（在标准层上）。分区数无效。这是围绕我应该期望的每个blob存储索引器吗？

我需要更快的吞吐量，所以我应该考虑滚动自己的索引器并通过其余的api批量调用吗？

1 个答案:

答案 0 :(得分：1)

要确认一下，您使用的是"parsingMode": "json"配置吗？如果是这样，您可以通过增加索引器批量大小来显着提高性能。默认批量大小为10，如果文档很小，则过低;尝试将其增加到1000（允许的最大值）。您可以使用.NET SDK或REST API（搜索batchSize）以编程方式增加Azure门户（编辑索引器刀片）中的批量大小。

如果性能仍然不能满足您的要求，您通常可以通过对输入数据进行分区并创建多个数据源/索引器对来增加索引器吞吐量，所有数据源/索引器对都写入相同的目标搜索索引（服务将多个分区真正在这种情况下很方便）。

当然，您仍然可以使用push API来完全控制索引请求的计时和批处理。