Azure认知搜索突出显示修剪

时间:2020-05-11 14:15:37

标签: azure azure-cognitive-search hit-highlighting

这是 Azure认知搜索小组的问题。

当前,我们一直在Azure认知搜索中不断遇到点击突出显示机制的问题。 突出显示的最大大小限制为1000个字符,并且不能使用API​​参数来增加。

问题在于,我们经常会看到一个高光,根本没有高亮显示任何关键字,并且此“高光”的长度为1,000,很可能它们被裁剪为适合1000个字符的限制。因此,如果匹配实际上没有突出显示,那么我们的用户就看不到突出显示。

在没有任何逻辑的情况下修剪高光有什么意义?因为有时候我们甚至遇到这样的情况,即在比赛中途突出显示高亮部分,换句话说,高亮部分以文本结尾:'...一些突出显示的文本[match] keyword [/ ma“。如您所见,关闭标签已被裁剪,并且我们看到的是“ [/ ma”而不是“ [/ match]”。

您如何期望有人使用它? ... 有什么解决方法吗?

1 个答案:

答案 0 :(得分:1)

我是Azure认知搜索团队的一名工程师。我们会突出显示这些边缘情况,并为您的用例带来负面影响,我们深表歉意。这是最近的一项更改,旨在作为针对因突出巨大片段而引起的服务稳定性问题的权宜之计。

我们正在总体上升级热门的重点报道体验,并将于2020年7月15日对客户开放。更多详细信息,请参见here。但是,仅对当天之后创建的服务启用新的体验。对于较旧的服务,目前唯一的解决方法是对字段文本进行预处理,以使每个句子的长度(突出显示的边界)小于1000。

随时可以通过azuresearch_contact@microsoft.com与PG联系,以获取有关您的情况的更多详细信息,我们将尽力减轻您的问题。