Azure搜索是否处理同义词

时间:2015-07-02 09:14:40

标签: azure azure-search

可以" Azure搜索"基于同义词搜索?

  

E.g。如果我搜索' shoes',系统应该获取结果   鞋子的同义词,如shoes,sandals e.t.c。

我搜索了很多,却未能找到适当的文档。我能找到的最接近的帖子是说它还没有支持,但它是一个旧帖子 - https://social.msdn.microsoft.com/Forums/en-US/9d0873cf-14aa-4d3e-b33f-a047963e8671/internationalized-search-finding-both-color-and-colour?forum=azuresearch

1 个答案:

答案 0 :(得分:3)

很遗憾,我们尚未向Azure Search添加自动同义词支持。当然,正如您可能想象的那样,这是一个非常重要的特征,我们听到了很多,所以我们确实在这个领域有计划。与此同时,请允许我指点一下:

1)我们支持词干,事实上,作为我们的预览api 02-28-2015-Preview的一部分的Microsoft自然语言处理器(NLP)非常擅长于lemitization,它提供了对50种语言的真正深入理解你得到不同形式的单词。在英语中,一个很好的例子就是当你搜索鼠标时我们可以找到鼠标。它也处理时态(男性/女性形式的话)。我意识到这不是你在问题中提到的,但可能是你可以利用的东西。有关详细信息,请访问:https://azure.microsoft.com/en-us/documentation/articles/search-api-2015-02-28-preview/#LanguageSupport

2)如果您知道要使用的同义词,可以使用一些技术来实现Azure搜索中的同义词支持,包括:

  • 使用我们的Collection数据类型,您可以在其中浏览文档的内容,并且可能与同义词相匹配,将该同义词添加到该文档的集合字段中。这样,如果有人搜索了同义词,它就会出现匹配
  • 创建一个仅包含这些同义词的单独索引。当你进行搜索(或建议搜索)时,它会反对这个“同义词”索引来获取所有可能的匹配,然后对主索引进行适当的查询。

我希望有帮助