我使用的是ES2.3,我有一个停用词文件列表,这些词混合了大写和小写形式 我正在尝试创建一个忽略停用词大小写的分析器
"stopword_analyzer": {
"type": "standard",
"ignore_case": "true"
"stopwords_path": "stopwords_english.txt"
}
我尝试在鞋帮中使用singel停用词来检查stopwords_path argumant是否存在问题
"stopword_analyzer6": {
"type": "stop",
"stopwords": "[UPPERCASE]",
"ignore_case": "true"
}
但这也失败了
我也尝试应用小写过滤器,但效果不佳
"stopword_analyzer5": {
"type": "stop",
"stopwords_path": "stopwords_english.txt",
"filter": [
"lowercase"
]
答案 0 :(得分:0)
我最终完成的工作达到了目的,在自定义分析器上使用了停用词过滤器和小写过滤器
"analysis": {
"filter": {
"my_stop":{
"type": "stop",
"ignore_case": "true",
"stopwords_path": "stopwords_english.txt"
}
},
"analyzer": {
"stopword_analyzer7": {
"type": "custom",
"tokenizer": "whitespace",
"stopwords_path": "stopwords_english.txt",
"filter": [
"lowercase",
"my_stop"
]
}
}
}