Solr搜索返回不同的输出

时间:2014-01-22 11:14:59

标签: search solr lucene arabic bitnami

我使用bitnami solr 4.6.0-1来搜索阿拉伯语和英语单词。虽然我试图搜索一个阿拉伯语单词,例如:'أبدلخبير'它带来4输出如下

<result name="response" numFound="4" start="0">
<doc><str name="Arname">أبدل</str></doc>
<doc><str name="Arname">أبدل يحيا</str></doc>
<doc><str name="Arname">كلسم حبير</str></doc></doc>
<doc><str name="Arname">حبير</str></doc>

执行查询,如select?q=Arname%3A++أبدل+خبير~0.75&fl=Arname&wt=xml&indent=true

但是当我以相反的顺序搜索单词'خبيرأبدل'时它只带来了2个输出

<result name="response" numFound="4" start="0">
<doc><str name="Arname">أبدل</str></doc>
<doc> <str name="Arname">أبدل يحيا</str></doc>
</result>

查询执行方式与select?q=Arname%3A++خبير+أبدل~0.75&fl=Arname&wt=xml&indent=true

类似

设置为Arname的字段类型是text_ar text_ar的架构如下

<fieldType name="text_ar" class="solr.TextField" positionIncrementGap="100">
        <analyzer>
            <tokenizer class="solr.StandardTokenizerFactory"/>
            <!-- for any non-arabic -->
            <filter class="solr.LowerCaseFilterFactory"/>
            <filter class="solr.StopFilterFactory" ignoreCase="true" words="lang/stopwords_ar.txt" />
            <!-- normalizes ﻯ to ﻱ, etc -->
            <filter class="solr.ArabicNormalizationFilterFactory"/>
            <filter class="solr.ArabicStemFilterFactory"/>
        </analyzer>
    </fieldType>

请告诉我一个解决方案。

0 个答案:

没有答案