通过一个例子解释elasticsearch中的hunspell令牌过滤器

时间:2015-01-06 10:23:16

标签: elasticsearch

嗨,我是elasticsearch的新手。我无法理解弹性搜索网站中的hunspell过滤器。我需要完整的解释hunspell过滤器和清晰的例子。

http://www.elasticsearch.org/guide/en/elasticsearch/reference/current/analysis-hunspell-tokenfilter.html

由于 Kumar K。

1 个答案:

答案 0 :(得分:2)

词干是将单词转换为基本形式的过程。 例如:

[ jumping , jumps , jumped ] => jump
[ running , ran ] => run

有两种方法可以解决这个问题

算法方法 - 使用算法执行此操作。但随后制定一套规则,例如"删除ed"或者"删除"在所有情况下都不会完全奏效。在一些花瓶中它可能会适得其反。但是这样可以提高搜索速度。 Porter stem和snowball是其中一些算法

基于词典 - 这就是hunspell进入画面的地方。 Hunspell有一个字典,它在这些变体和它们的基本形式之间有映射。它在这个字典上查找以解析这个单词。因此,hunspell对于词干非常准确但在搜索方面很慢,因为涉及查找。