Solr显示PDF页面以及结果

时间:2011-08-18 15:42:33

标签: solr apache-tika

我的问题只是这个活动的延续,我想在输入文档中显示搜索到的单词的页面号。

Solr open document after searching a keyword

所以我用

1) tika-0.9.jar 将输出提取为中间文件。

2)然后我创建另一个XML,其中提取的输出是输入并以Solr期望的格式写入数据,然后使用 post.jar 命令发布此xml。

3)我使用 Solritas Serach UI Solr 3.2 版本(http://localhost:8983/solr/browse)查看结果。

我想显示页面没有以及结果。

示例:

如果我在输入PDF中搜索单词测试,到目前为止我所掌握的是显示包含此结果的所有文档集,并且单击任何文档时输入PDF将打开。我想显示这个词在每个输入文档中出现'test'的位置。

请给我一些建议,比如是否可以通过某些方式将页面存储在索引中来完成。

非常欢迎您的建议。

谢谢和问候。

0 个答案:

没有答案