我在天蓝色搜索中建立了一个索引。索引包含几个字段,但只有2个字段我标记为可搜索。 该索引有各种大小的pdf文件(当然是它们的文本)以及能够在文档搜索中使用的purporse。
索引很大 - 160k文档和7.2 GB大小。
当我查询到2个字母时,一切都运行正常,但是当我遇到复杂的单词时,表现很糟糕。
例如:短语 - elasti花了59秒。
在我的查询中 - 我使用过滤器,评分配置文件突出显示
经过一些调查 - 我可以看到突出显示功能导致问题。
有什么想法吗?如何提高性能 - 可能会分成索引中的几个字段或类似的东西?
答案 0 :(得分:0)
您的猜测是正确的 - 搜索突出显示导致此问题。启用突出显示后,Azure搜索会在查询时间处理结果集中的每个项目/文本,以查找包含搜索命中的文本段。如果每个文本是4.5mb(7.2gb / 160k),则该过程可能需要很长时间。对于花费较长时间的复杂术语或短语,这是因为Azure Search在找到足够数量的段后停止处理结果。我在Azure搜索团队工作。我会查看代码并确认。