Question

我正在使用标准的Solr ngram字段定义 -

<fieldType name="ngram" class="solr.TextField" positionIncrementGap="100" stored="false" multiValued="true">
  <analyzer type="index">
    <tokenizer class="solr.StandardTokenizerFactory"/>
    <!-- potentially word delimiter, synonym filter, stop words, NOT stemming -->
    <filter class="solr.LowerCaseFilterFactory"/>
    <filter class="solr.NGramFilterFactory" minGramSize="2" maxGramSize="15"/>
  </analyzer>
  <analyzer type="query">
    <tokenizer class="solr.StandardTokenizerFactory"/>
    <!-- potentially word delimiter, synonym filter, stop words, NOT stemming -->
    <filter class="solr.LowerCaseFilterFactory"/>
  </analyzer>
</fieldType>

<field name="item" type="text" indexed="true" stored="true"/>
<field name="item_ngram" type="ngram" indexed="true" stored="true"/>

现在“item：ipad AND item：2”找到“iPad 2”，但“item_ngram：ipad AND item_ngram：2”没有。

有什么想法吗？

Answer 1

你的n-gram最小长度为2（minGramSize =“2”）。所以item_ngram：2在任何事情上都不匹配。将它减少到1，你就会得到匹配。

Solr ngram与数字不匹配？

1 个答案: