我已经将大约15,000个文档加载到各种尺寸的Solr中。我测量的最大值是59,455个纯文本字符。当我使用突出显示和无限制的片段大小执行查询时,此大文档将被截断为51,253(这包括我的前置和后置标记)。
以下是查询的网址:
http://solr.nowhere.org:8080/solr/select?fl=*,score&sort=score%20desc&hl=true&hl.fragsize=-1&hl.fl=note&hl.simple.pre=<hit>&hl.simple.post=</hit>&hl.q=corn&q=corn
为什么Solr仍在截断?
我正在使用Solr 4.0。
答案 0 :(得分:1)
您还需要提高hl.maxAnalyzedChars的值,因为此值也限制了突出显示结果。
在文档中查找多少个字符以查找合适的代码段。此参数仅适用于原始荧光笔。
默认值为“51200”。
您可以为此参数指定较大的值,并使用hl.fragsize = 0在大于51200个字符的大字段中返回突出显示。
因此,根据此更改为hl.fragsize=0
,并将大于最长文档的值添加到hl.max.analyzedChars
参数。