Question

我正在使用SOLR 4.9.0以及以下配置（我只包括我认为与问题相关的部分）：

    <field name="content"   type="text" indexed="true" stored="false"
 termVectors="true" multiValued="false" />

     <fieldType name="text" class="solr.TextField">
         <analyzer type="index">
             <tokenizer class="solr.StandardTokenizerFactory" />
             <filter class="solr.LowerCaseFilterFactory" />
         </analyzer>
         <analyzer type="query">
             <tokenizer class="solr.StandardTokenizerFactory" />
             <filter class="solr.LowerCaseFilterFactory" />
         </analyzer>
     </fieldType>

我可以近距离搜索一个接近另一个词的术语：

content:"very suggestion"~100

我需要添加能够搜索接近数字标记的术语的功能，例如：

content:"very [0.01 TO 0.99]"~100
content:"very [100 TO 1000000]"~100

是否有已经提供此功能的tokenizer？

如果没有，为了使标准标记器能够做到这一点，大致会有哪些步骤？

对索引结构，大小和索引/搜索速度的影响有什么猜测？

编辑：

我认为以下SOLR配置实际上也与我的问题相关：

 <requestHandler name="/select" class="solr.SearchHandler">
     <lst name="defaults">
         <str name="echoParams">explicit</str>
         <int name="rows">10</int>
         <str name="df">id</str>
         <str name="wt">json</str>
         <str name="indent">true</str>
         <str name="fl">* score</str>
     </lst>
 </requestHandler>

Answer 1

两年多以后，我找到了问题的答案：）

使用

https://lucene.apache.org/solr/guide/6_6/other-parsers.html#OtherParsers-ComplexPhraseQueryParser

可以做到：

{！complexphrase inOrder = false}内容：“费[100 10000]”~10

Lucene / SOLR术语到数字范围邻近搜索

1 个答案: