在Solr中,扩展多词同义词和术语位置

时间:2012-04-18 21:22:28

标签: solr lucene

我有一个同义词文件,在索引时使用,包含这个等价:

uc, university of california

然后我看了一下“uc berkeley”索引如何在analysis.jsp上查看。我很惊讶:

org.apache.solr.analysis.SynonymFilterFactory {synonyms=companysyns.txt, expand=true, ignoreCase=true, luceneMatchVersion=LUCENE_36}
position    1               2               3
term text   university      berkeley        california
            uc              of
type        SYNONYM         word            SYNONYM
            SYNONYM         SYNONYM
startOffset 0               3               3
            0               3
endOffset   2               11              11
            2               11

请注意,“伯克利”出现在“大学”和“加利福尼亚”之间。这意味着,当我搜索“加州大学伯克利分校”时,我没有得到匹配。但是“加州大学伯克利分校”有效!

如何确保“加州大学伯克利分校”正常运作?

谢谢!

2 个答案:

答案 0 :(得分:0)

我遇到了一个类似的问题,突出显示的响应突出显示了错误的单词。我正在使用solr 3.6

在我的用例中,在索引端配置了同义词,expand = true。

例如,如果我在synonyms.txt中有以下内容, dns,域名系统

我索引类似“有效的样本dns条目”。当我在突出显示的响应中搜索“名称”(没有引号)时,我得到“一个样本dns 条目”。如您所见,突出显示单词条目 此外,搜索“系统”会导致“样本dns条目 工作”

答案 1 :(得分:0)

看起来像一个已知的problem。提到了修复(将luceneMatchVersion设置为LUCENE_33)。不确定它是否适合你。我们希望他们能尽快解决。