在Solr 6.6

时间:2017-10-03 10:58:01

标签: parsing solr lucene tokenize solr6

如何防止过滤查询(如ss_content:70756_box4_v29.jpg)被解析如下

"filter_queries":["ss_content:(41339_box4_v29.jpg)"],
"parsed_filter_queries":["ss_content:41339_box4_v29 ss_content:jpg"]

在parsed_filter_queries中,文件名已被切割成2个单独的查询。即使我尝试将文件名包含在双引号中,它仍然将文件名分成两部分。

"filter_queries":["ss_content:\\\"70756_box4_v29.jpg\\\""],
"parsed_filter_queries":["ss_content:70756_box4_v29 ss_content:jpg"],

这导致查询显示不正确的结果,因为ss_content字段是关键字字段

例如

"ss_content":"628_test.jpg none  facets media image file type jpg type packaging graphics packaging generic year 1996 "

1 个答案:

答案 0 :(得分:1)

您需要调整ss_content字段正在使用的标记生成器。现在它在点上进行标记,从而创建两个要查询的术语。例如,将分析链设置为使用WhitespaceTokenizer(更好地仔细研究与您的用例最匹配的内容)。