我对在ElasticSearch中使用词干分析器感到困惑。
在Dealing with Human Language/Reducing Words to Their Root Form
部分,我看到词干分析器用于将单词删除为根形式。这让我相信Stemmers被用作分析仪上的标记过滤器。
但令牌过滤器只过滤令牌,实际上并没有将单词缩减为其根形式。
那么,使用词干分析器在哪里?
答案 0 :(得分:0)
实际上,您可以在分析器中使用令牌过滤器进行干预。这正是ES中的词干工作原理。看看documentation for Stemmer Token Filter。
ES还提供了Snowball Analyzer,这是一种方便的分析器,用于干预。
否则,如果您想使用不同类型的词干,您可以随时构建自己的Custom Analyzer。这使您可以完全控制最适合您的词干解决方案,如discussed here in the guide。
希望这有帮助!