Solr如何存储有限数量的文本而不是完全正文

时间:2016-08-04 07:33:39

标签: indexing solr

根据我们的业务需求,我需要索引全文正文(例如,将其视为新闻报道),但在Solr查询结果中,我需要返回一个预览文本(例如,前400个字符)以绑定到目标新闻列表页面。

据我所知,架构文件中有2个选项可用于存储= false / true的任何字段。我现在唯一可以看到的方法是将其设置为true并将结果中的完整故事正文然后摘录文本以手动预览,但这似乎不实用,因为(1)它将占用光盘上的GB空间存储全身和(2)json响应变得非常沉重。 (查询结果可以返回40K / 50K的故事。)

我也知道限制记录的数量,但由于某些原因,我们需要立即获得完整的结果。

有效实现此要求的任何帮助吗?

1 个答案:

答案 0 :(得分:0)

为了在新闻概述中只显示400个字符,您只需使用Solr Highlighting Feature并指定片段数量及其大小。例如,对于Standard highlighter,您有参数:

  

hl.snippets :指定每个字段生成的突出显示的最大代码段数。来自任何数量的片段都是可能的   零到这个值要生成。此参数接受每个字段   覆盖。

     

hl.fragsize :指定要突出显示的片段大小(以字符为单位)。 0表示不应该分段   考虑并应使用整个字段值。这个参数   接受每个字段的覆盖。

如果您想索引所有内容但只存储部分文本,那么您可以按照Solr社区中建议的解决方案here进行操作。