天蓝色搜索性能问题

时间:2015-02-25 16:21:36

标签: azure azure-search

我在天蓝色搜索中建立了一个索引。索引包含几个字段,但只有2个字段我标记为可搜索。 该索引有各种大小的pdf文件(当然是它们的文本)以及能够在文档搜索中使用的purporse。

索引很大 - 160k文档和7.2 GB大小。

当我查询到2个字母时,一切都运行正常,但是当我遇到复杂的单词时,表现很糟糕。

例如:短语 - elasti花了59秒。

在我的查询中 - 我使用过滤器,评分配置文件突出显示

经过一些调查 - 我可以看到突出显示功能导致问题。

有什么想法吗?如何提高性能 - 可能会分成索引中的几个字段或类似的东西?

1 个答案:

答案 0 :(得分:0)

您的猜测是正确的 - 搜索突出显示导致此问题。启用突出显示后,Azure搜索会在查询时间处理结果集中的每个项目/文本,以查找包含搜索命中的文本段。如果每个文本是4.5mb(7.2gb / 160k),则该过程可能需要很长时间。对于花费较长时间的复杂术语或短语,这是因为Azure Search在找到足够数量的段后停止处理结果。我在Azure搜索团队工作。我会查看代码并确认。