将zip文件处理成Solr

时间:2014-01-11 21:04:29

标签: solr apache-tika

我必须处理zip文件,其中包含多个zip文件,这些zip文件包含xml和图像文件。我必须将数据索引到solr中,这应该将结果作为XML数据的内容。

我尝试了默认的solr-Tika示例,当我查询它时,它只返回zip文件名。 我将如何实现这一目标?是Tika只是处理我的要求的方式?

提前致谢。

1 个答案:

答案 0 :(得分:2)

为了让Tika按照您的意愿工作,您可能需要将the patch attached to this ticket应用于当前的Solr。

是的,如果你想在没有任何其他工作的情况下索引zip文件的内容,Tika是你唯一的选择。