Solr高亮显示片段大小设置为无限制,但仍截断大文档?

时间:2013-03-26 16:17:05

标签: solr highlighting

我已经将大约15,000个文档加载到各种尺寸的Solr中。我测量的最大值是59,455个纯文本字符。当我使用突出显示和无限制的片段大小执行查询时,此大文档将被截断为51,253(这包括我的前置和后置标记)。

以下是查询的网址:

http://solr.nowhere.org:8080/solr/select?fl=*,score&sort=score%20desc&hl=true&hl.fragsize=-1&hl.fl=note&hl.simple.pre=<hit>&hl.simple.post=</hit>&hl.q=corn&q=corn

为什么Solr仍在截断?

我正在使用Solr 4.0。

1 个答案:

答案 0 :(得分:1)

您还需要提高hl.maxAnalyzedChars的值,因为此值也限制了突出显示结果。

  

在文档中查找多少个字符以查找合适的代码段。此参数仅适用于原始荧光笔。

     

默认值为“51200”。

     

您可以为此参数指定较大的值,并使用hl.fragsize = 0在大于51200个字符的大字段中返回突出显示。

因此,根据此更改为hl.fragsize=0,并将大于最长文档的值添加到hl.max.analyzedChars参数。