在Solr for PDF中生成突出显示的片段

时间:2013-05-03 20:38:18

标签: solr

我是solr的新手。我已经设置了一个solr服务器并索引了几千个PDF。我试图通过PHP页面中的其余API查询solr。我正在尝试构建类似于教程中包含的solritas界面(solrserver / browse),但我不知道如何生成突出显示的片段。我在文档" hl"中找到了是一个查询参数,默认情况下设置为false。

当我得到http://solrserver/?q=search+term&hl=true时,我会收到带有高亮部分的回复,但它只包含文档ID,没有生成的代码段。

我正在使用教程提供的solr 4.2.1架构和配置。我相信配置很好,因为solritas能够使用相同的索引数据显示突出显示的片段。我已经尝试过看看如何构建solritas但是它已经在.vm模板文件中分离出来了,我还没能找到我正在寻找的东西。

我可以在doc->内容区域看到PDF的全文,因此会存储它。我想我只是不明白生成片段的正确方法!有人可以帮忙!

谢谢:)

1 个答案:

答案 0 :(得分:2)

我建议你应该尝试使用hl.fl参数。所以你的查询应该是这样的:

问=搜索+术语安培; HL =真安培; hl.fl = FIELD1,FIELD2,字段3

其中field1,field2和field3是您想要生成高光的三个源字段。

在您的情况下,如果您要用于突出显示的字段名称是内容,则您的查询可以是:

问=搜索+术语安培; HL =真安培; hl.fl =含量

更多详情:http://docs.lucidworks.com/display/solr/Highlighting

通过突出显示,您甚至可以指定片段大小,突出显示的文本周围的HTML标记等...