弹性搜索中词组匹配的模糊性

时间:2017-01-19 09:57:47

标签: elasticsearch

如何在词组匹配中包含模糊性?在elasticsearch文档中,提到短语匹配不支持模糊性。 我有包含短语的文档现在我有一个文本正文,现在我想找出文档中的文本和短语的常用短语,但需要搜索可能拼写错误的短语。

1 个答案:

答案 0 :(得分:0)

有一些方法可以做到这一点:

  1. 删除空格并将孔短语索引为一个标记(我认为在弹性中有一个过滤器)。在您的查询中,您必须这样做。
  2. 有一个Tokenizer,我忘记了名字(也许有人可以在这里帮忙?),它可以让你把多个单词索引在一起。如果你的短语有一个共同的最大长度,如5个字左右,这可以做到这一点。
  3. 小心fuzzi只能使用最大距离2,所以如果你有一个很长的句子,2可能不够,你必须拆分它。