嗨,我是elasticsearch的新手。我无法理解弹性搜索网站中的hunspell过滤器。我需要完整的解释hunspell过滤器和清晰的例子。
由于 Kumar K。
答案 0 :(得分:2)
词干是将单词转换为基本形式的过程。 例如:
[ jumping , jumps , jumped ] => jump
[ running , ran ] => run
有两种方法可以解决这个问题
算法方法 - 使用算法执行此操作。但随后制定一套规则,例如"删除ed"或者"删除"在所有情况下都不会完全奏效。在一些花瓶中它可能会适得其反。但是这样可以提高搜索速度。 Porter stem和snowball是其中一些算法
基于词典 - 这就是hunspell进入画面的地方。 Hunspell有一个字典,它在这些变体和它们的基本形式之间有映射。它在这个字典上查找以解析这个单词。因此,hunspell对于词干非常准确但在搜索方面很慢,因为涉及查找。