Solr搜索 - Tika从PDF中提取文本而不返回突出显示片段

时间:2012-08-07 20:32:15

标签: solr highlighting apache-tika

我已经成功索引了Pdf-使用Tika-和纯文本 - 从数据库中获取 - 在一个单独的集合中。现在我正在尝试实现突出显示。当我查询Solr时,我将以下内容放入网址:http://myhost:8090/solr/ktm/select/?q=BlahBlah&start=0&rows=120&indent=on&hl=true&wt=json。一切都好。收到的输出具有“docs”下的原始(非突出显示文本)内容和“突出显示”下突出显示的片段。但我注意到Tika提取的文件没有“突出显示”片段。那种反应,给我带来了许多麻烦(零长度行)。是否有任何解决方法来解决它?我已经尝试过copyField(在索引时),但响应是空白({“突出显示”:{}})。我真的需要帮助。

0 个答案:

没有答案