带正斜杠的Solr查询不匹配

时间:2019-07-21 05:30:39

标签: solr lucene

Solr 4.9.1(无法更新,因为这是Silverstripe插件)。问题出在前端,但以下内容直接出自Solr查询面板。我是Solr的新手,到目前为止,我一直在研究有关Tokenizers和Filters的建议(但在此问题中无法理解这些建议)和escaping(似乎没有做任何事情)

这是我的调试输出示例:

现有文档中的字段值:遍及全球-飞行/航行

查询(前端):飞行/航行

搜索结果: 0

调试输出:

"rawquerystring": "Fly/Sail",
"querystring": "Fly/Sail",
"parsedquery": "PhraseQuery(_text:\"fly sail fly sail\")",
"parsedquery_toString": "_text:\"fly sail fly sail\"",
"explain": {},
"QParser": "LuceneQParser"

让我最困惑的是这就是为什么在解析查询中加倍?用反斜杠转义正斜杠不会改变任何内容。

如果我搜索"Fly Sail",则会显示预期结果。

编辑:我的配置:

<fields>
<field name='_documentid' type='string' indexed='true' stored='true' required='true' />
<field name='ID' type='tint' indexed='true' stored='true' required='true' />
<field name='_text' type='htmltext' indexed='true' stored='true' multiValued='true' />
<field name='VivaTour_TourName' type='text' indexed='true' stored='true' multiValued=''/>
<field name='VivaTour_TourDescription' type='htmltext' indexed='true' stored='true' multiValued=''/>

编辑2:此搜索的“分析”页面的屏幕截图

https://imgur.com/a/164XNEK

1 个答案:

答案 0 :(得分:0)

在字段fieldType中尝试以下"VivaTour_TourName"

<fieldType name="text_wd" class="solr.TextField" positionIncrementGap="100">
    <analyzer type="index">
          <!-- Splits words based on whitespace characters --> 
          <tokenizer class="solr.WhitespaceTokenizerFactory"/>
          <!-- splits words at delimiters based on different arguments --> 
          <filter class="solr.WordDelimiterGraphFilterFactory" preserveOriginal="1" catenateWords="1"/>
          <!-- Transforms text to lower case -->   
          <filter class="solr.LowerCaseFilterFactory"/>
        </analyzer>

        <analyzer type="query">
          <tokenizer class="solr.WhitespaceTokenizerFactory"/>
          <filter class="solr.LowerCaseFilterFactory"/>
        </analyzer>
  </fieldType>

修改schema.xml后,请重新启动服务器并重新索引数据。

请参考屏幕截图以供参考。

solr analysis screen 1

solr analysis screen 2

相关问题