Solr StandardTokenizerFactory to dotsize on dots filter

时间:2012-12-27 13:35:59

标签: java apache solr solrj

我不想在我的索引中搜索某些数字,但我遇到了某些结果的问题。 (我正在使用edismax。)

示例:

    Term in index  I want to search: b1.123.456
    Query I use is b1 123 456 (no spaces)

这不起作用,因为a。是不一样的 - (我已阅读文档) 我找了一个解决方案,发现我必须在我的字段上使用过滤器:

<fieldType name="text_general" class="solr.TextField" positionIncrementGap="100">
  <analyzer type="index">
    <charFilter  class="solr.MappingCharFilterFactory" mapping="mapchar.txt" />
    <tokenizer class="solr.StandardTokenizerFactory"/>
    <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" enablePositionIncrements="true" />
    <filter class="solr.LowerCaseFilterFactory"/>
  </analyzer>
  <analyzer type="query">
    <charFilter  class="solr.MappingCharFilterFactory" mapping="mapchar.txt" />
    <tokenizer class="solr.StandardTokenizerFactory"/>
    <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" enablePositionIncrements="true" />
    <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/>
    <filter class="solr.LowerCaseFilterFactory"/>
  </analyzer>
</fieldType>

这是我的fieldtype,mapchar包含“。”=&gt;“”

现在,当我尝试搜索时:

    b1.123.456   returns all results for each token (normal behaviour)
    "b1.123.456" returns what I'm looking for.
    "b1 123 456" returns what I'm looking for.
     b1 123 456  **returns nothing**

为什么没有短语搜索的正常edismax查询返回0结果?

编辑:

我在使用上一个查询时在日志中发现错误:

<record>
  <date>2012</date>
  <millis></millis>
  <sequence></sequence>
  <logger>org.apache.solr.servlet.SolrDispatchFilter</logger>
  <level>SEVERE</level>
  <class>org.apache.solr.common.SolrException</class>
  <method>log</method>
  <thread>12</thread>
  <message>null:java.lang.NumberFormatException: For input string: ""
    at java.lang.NumberFormatException.forInputString(Unknown Source)
    at java.lang.Integer.parseInt(Unknown Source)
    at java.lang.Integer.parseInt(Unknown Source)
    at org.apache.solr.util.SolrPluginUtils.calculateMinShouldMatch(SolrPluginUtils.java:563)
    at org.apache.solr.util.SolrPluginUtils.setMinShouldMatch(SolrPluginUtils.java:518)
    at org.apache.solr.search.ExtendedDismaxQParser.parse(ExtendedDismaxQParserPlugin.java:264)
    at org.apache.solr.search.QParser.getQuery(QParser.java:143)
    at org.apache.solr.handler.component.QueryComponent.prepare(QueryComponent.java:118)
    at org.apache.solr.handler.component.SearchHandler.handleRequestBody(SearchHandler.java:185)
    at org.apache.solr.handler.RequestHandlerBase.handleRequest(RequestHandlerBase.java:129)
    at org.apache.solr.core.SolrCore.execute(SolrCore.java:1699)
    at org.apache.solr.servlet.SolrDispatchFilter.execute(SolrDispatchFilter.java:455)
    at org.apache.solr.servlet.SolrDispatchFilter.doFilter(SolrDispatchFilter.java:276)
    at ...
</message>
</record>

1 个答案:

答案 0 :(得分:0)

由于默认查询处理程序有效(/ select),我开始认为我的查询处理程序出了问题。

为了找出错误,我开始禁用部分自己的请求处理程序。

  <!--<str name="mm"></str>-->

空mm 可以为您提供错误

我曾经有一个mm参数,但我不再需要它,所以我把它留空......