为什么我的文本被solr.KeywordTokenizerFactory标记化?

时间:2015-09-29 05:28:55

标签: solr lucene

我一直在试着解决这个问题已经有一天了。这是schema.xml

中字段类型的定义
    <fieldType name="text_plain" class="solr.TextField" positionIncrementGap="100">
        <analyzer type="index">
            <tokenizer class="solr.KeywordTokenizerFactory" />
        </analyzer>
        <analyzer type="query">
            <tokenizer class="solr.KeywordTokenizerFactory" />
        </analyzer>
    </fieldType>

除其他外,我已将索引编入&#34; Unity很棒&#34; (没有双引号)。如果我搜索&#34; Unity&#34;,我会得到结果。如果我搜索&#34; Unity&#34;,我会得到所有被索引的结果(我相信这是因为空白被索引)。如果我搜索&#34; Unity i&#34;,我什么也得不到。我试图使用这样的查询进行搜索:fieldName:nameParam *,其中nameParam是搜索查询参数,fieldName是已编制索引的字段。

我想要的是获得完整短语的结果,例如当我使用查询&#34; Unity i&#34;进行搜索时,我只需要一个结果。

1 个答案:

答案 0 :(得分:0)

好的,我在阅读完这篇文章后发现了这个问题:Replace space characters in paths with what?

在查询时我所要做的只是逃避空间。