索引Solr的长字符串长度

时间:2016-05-11 09:16:54

标签: java solr solrj

我有一个字符串类型数据,其中包含26357个长度。 使用SolrJ索引上面的数据时,它会给出如下错误。 (在我的个人测试中,它最长可达14000字符串长度)

错误消息:来自(我的本地主机)服务器的错误将文档ID 5ba59584a96fef13写入索引的异常;可能的分析错误。

以下是我的问题:  如果我为我的solr增加Java堆内存,它会解决上述问题吗?  或者是否有任何用于索引长文本的配置?

请参考下面的模式文件,我的Solr版本是5.2.1。

 <field name="description" type="text_general" indexed="true" stored="false" required="false" />


  <fieldType name="text_general" class="solr.TextField" positionincrementGap="100">
   <analyzer type="index">
   <tokenizer class= "...">
   <filter class="...">
   <filter class="solr.LimitTokenCountFilterFactory" maxTokenCount="300000"/>
   </analyzer>
   <analyzer type="query">
    ..
    ..
    ..
   <filter class="solr.LimitTokenCountFilterFactory" maxTokenCount="300000"/>
    </analyzer>
    <fieldType>

1 个答案:

答案 0 :(得分:0)

尝试将此过滤器用于较大长度的字符串。提到你的字符串的最大长度值

<filter class="solr.LengthFilterFactory" min="2" max="7"/>

如果您正在尝试令牌计数过滤器 从索引和查询分析器中删除过滤器LimitTokenCountFilterFactory应该可以解决问题。