我有一个同义词文件,在索引时使用,包含这个等价:
uc, university of california
然后我看了一下“uc berkeley”索引如何在analysis.jsp上查看。我很惊讶:
org.apache.solr.analysis.SynonymFilterFactory {synonyms=companysyns.txt, expand=true, ignoreCase=true, luceneMatchVersion=LUCENE_36}
position 1 2 3
term text university berkeley california
uc of
type SYNONYM word SYNONYM
SYNONYM SYNONYM
startOffset 0 3 3
0 3
endOffset 2 11 11
2 11
请注意,“伯克利”出现在“大学”和“加利福尼亚”之间。这意味着,当我搜索“加州大学伯克利分校”时,我没有得到匹配。但是“加州大学伯克利分校”有效!
如何确保“加州大学伯克利分校”正常运作?
谢谢!
答案 0 :(得分:0)
我遇到了一个类似的问题,突出显示的响应突出显示了错误的单词。我正在使用solr 3.6
在我的用例中,在索引端配置了同义词,expand = true。
例如,如果我在synonyms.txt中有以下内容, dns,域名系统
我索引类似“有效的样本dns条目”。当我在突出显示的响应中搜索“名称”(没有引号)时,我得到“一个样本dns 条目”。如您所见,突出显示单词条目 此外,搜索“系统”会导致“样本dns条目 工作”
答案 1 :(得分:0)
看起来像一个已知的problem。提到了修复(将luceneMatchVersion设置为LUCENE_33)。不确定它是否适合你。我们希望他们能尽快解决。