在弹性搜索中获取默认停止词列表

时间:2016-11-21 11:21:23

标签: search elasticsearch documentation

我试图找出弹性搜索的预定义停用词列表是什么,但我没有找到有关此文档的读取API。

所以,我想找到this predefined variables_arabic_, _armenian_, _basque_, _brazilian_, _bulgarian_, _catalan_, _czech_, _danish_, _dutch_, _english_, _finnish_, _french_, _galician_, _german_, _greek_, _hindi_, _hungarian_, _indonesian_, _irish_, _italian_, _latvian_, _norwegian_, _persian_, _portuguese_, _romanian_, _russian_, _sorani_, _spanish_, _swedish_, _thai_, _turkish_

的单词列表

我在文档中找到了english stop word list,但我想检查它是否是我的服务器真正使用的那个,并检查其他语言的停用词列表。

1 个答案:

答案 0 :(得分:12)

英语分析器使用的停用词与Standard Analyzer中定义的停用词相同,即您在文档中找到的停用词。

可以在analysis/common/src/resources/org/apache/lucene/analysis文件夹中的Lucene存储库中找到所有其他语言的停用词文件。