搜索结果在solr 4.7中对于西班牙语字符不匹配

时间:2014-03-28 13:06:51

标签: solr

搜索未在solr 4.7中显示西班牙字符(如ñ和Ñ)的正确结果。我在solr帮助中搜索过,发现字符不在ASCII范围内。

如何使用ASCII字符映射非ASCII字符? 例如:在solr指数中,我们有charsñ,Ñ[带有TILDE的拉丁文大写字母N]或正常的n,N 应该使用什么过滤器/令牌来搜索Normal N或Ñ,并且两者都应该被映射?

字符Ń[带有急性的拉丁文大写字母N]作为例外。

1 个答案:

答案 0 :(得分:1)

我尝试使用the ICUFoldingFilterFactory这适用于那些重音。如果设置这个很棘手,请查看SO问题Can not use ICUTokenizerFactory in Solr

此分析仪

<fieldType name="spanish" class="solr.TextField">
    <analyzer>
        <tokenizer class="solr.StandardTokenizerFactory" />
        <filter class="solr.ICUFoldingFilterFactory" />
    </analyzer>
</fieldType>

得到了我这些分析结果,屏幕截图取自solr-admin

analysis results from solr-admin for Spanish input