在solr中禁用小写字段的小写

时间:2012-01-16 15:44:13

标签: solr full-text-search faceted-search

我正在使用solr 3.5并添加了一个自定义字段,它通过在schema.xml中定义以下内容来为文档添加类别。

<field name="category" type="string" indexed="true" stored="true"/>

现在我正在实现一个Search-Web-Client,它应该显示该类别字段索引的所有值。我用以下查询做到了:

facet=true&facet.field=category&q=*

结果如下:

<response>
 <lst name="responseHeader">
  <int name="status">0</int>
  <int name="QTime">45</int>
  <lst name="params">
   <str name="facet.field">category</str>
   <str name="q">*</str>
   <str name="facet">true</str>
  </lst>
 </lst>
 <result name="response" numFound="0" start="0" maxScore="0.0"/>
  <lst name="facet_counts">
  <lst name="facet_queries"/>
  <lst name="facet_fields">
  <lst name="category">
   <int name="category1">0</int>
   <int name="category2">0</int>
   <int name="category3">0</int>
   <int name="category4">0</int>
   <int name="category5">0</int>
  </lst>
 </lst>
 <lst name="facet_dates"/>
  <lst name="facet_ranges"/>
  </lst>
</response>

我的Web客户端显示所有类别的名称,但它们以小写字母书写,但以大写字母存储在索引中。

<response>
 <result>
  <doc>
   ...
   <str name="category">Category1</str>
   ...
  </doc>
 </result>
</response>
  • 解决方案a:是否可以强制将facet-values名称区分大小写?
  • 解决方案b:是否有另一个查询会给出索引中存储的每个类别值?

1 个答案:

答案 0 :(得分:12)

我怀疑您使用LowerCaseFilterFactory作为string类型的字段。在这种情况下,索引值为category1,但存储的值仍然是您提交的原始值Category1

您应该从LowerCaseFilterFactory中的string fieldType定义中删除schema.xml,以获得所需的构面行为。

事实上,使用具有简单fieldType的facet的特定copyField是常见的,没有TokenizerFilter等。