Azure搜索索引器对于大量文档来说太慢了

时间:2018-04-11 20:30:31

标签: azure-storage azure-search

我在blob存储的单个容器中有大约600,000个文件的S1层。我已经将索引限制为仅包括(.doc,.docx,.xls,.xlsx,.ppt,.pptx,.pdf,.txt,.rtf,.htm,.html)和排除(.png,。 JPEG,个.jpg,.gif .PSD,.MP3,.MP4,.WAV,.exe文件,.zip文件,的.dmg,.msi程序,.MKV,FLV的,.OGG,的.ogv,.AVI,.MOV .WMV)。我还尝试将分区增加到允许的最大值12,而性能没有太大变化。

使用当前的索引速度,我可以估计30天完成该过程。

我需要将其编入索引更快。我怎样才能提高速度呢?

感谢。

1 个答案:

答案 0 :(得分:0)

您可以通过并行化来加快索引编制:将容器中的blob拆分为多个文件夹,并创建多个数据源/索引器对,所有这些都写入同一目标搜索索引。如果您的搜索服务具有N个搜索单元,则N索引器可以同时运行,从而显着加快索引速度。