我必须处理zip文件,其中包含多个zip文件,这些zip文件包含xml和图像文件。我必须将数据索引到solr中,这应该将结果作为XML数据的内容。
我尝试了默认的solr-Tika示例,当我查询它时,它只返回zip文件名。 我将如何实现这一目标?是Tika只是处理我的要求的方式?
提前致谢。
答案 0 :(得分:2)
为了让Tika按照您的意愿工作,您可能需要将the patch attached to this ticket应用于当前的Solr。
是的,如果你想在没有任何其他工作的情况下索引zip文件的内容,Tika是你唯一的选择。