我有一个字符串类型数据,其中包含26357个长度。 使用SolrJ索引上面的数据时,它会给出如下错误。 (在我的个人测试中,它最长可达14000字符串长度)
错误消息:来自(我的本地主机)服务器的错误将文档ID 5ba59584a96fef13写入索引的异常;可能的分析错误。
以下是我的问题: 如果我为我的solr增加Java堆内存,它会解决上述问题吗? 或者是否有任何用于索引长文本的配置?
请参考下面的模式文件,我的Solr版本是5.2.1。
<field name="description" type="text_general" indexed="true" stored="false" required="false" />
<fieldType name="text_general" class="solr.TextField" positionincrementGap="100">
<analyzer type="index">
<tokenizer class= "...">
<filter class="...">
<filter class="solr.LimitTokenCountFilterFactory" maxTokenCount="300000"/>
</analyzer>
<analyzer type="query">
..
..
..
<filter class="solr.LimitTokenCountFilterFactory" maxTokenCount="300000"/>
</analyzer>
<fieldType>
答案 0 :(得分:0)
尝试将此过滤器用于较大长度的字符串。提到你的字符串的最大长度值
<filter class="solr.LengthFilterFactory" min="2" max="7"/>
如果您正在尝试令牌计数过滤器
从索引和查询分析器中删除过滤器LimitTokenCountFilterFactory
应该可以解决问题。