标签: azure-cognitive-search
我有一个包含以下文本的文档的索引:
约翰的车在商店里。
在此文本中搜索John不会返回文档(使用默认分析器)。索引器似乎没有将单引号视为终止符。该查询没有单引号,所以我没有转义任何内容-索引文本具有单引号。
请注意,当我搜索John(包括单引号)时,将返回正确的结果。单引号是ASCII字符39,而不是一些花哨的Unicode撇号字符。
这是一个已知问题吗?如果可以的话,是否有解决方法?
谢谢。
答案 0 :(得分:1)
默认分析器仅进行最少的特定于语言的假设(例如,单词之间用空格和标点符号分隔)。如果您希望搜索引擎考虑英语元素(包括消除示例中的所有格),则可以使用英语分析器之一。请注意,英语分析器还执行其他操作,例如词干分析或词条定理(取决于您选择的分析器)。如果您只想要所有格排除法,则可以创建一个自定义分析器,并使用启用了所有格排除选项的单词定界符标记过滤器。有关如何使用内置分析器(例如英语here)的更多信息,有关如何构建自定义分析器和令牌过滤器的选项列表here的更多信息。