我正在开发一个索引PDF文档的项目(目前主要是PDF)。我发现弹性搜索可以使用Apache Tika索引附加文档。
我已实现弹性搜索,索引少量PDF文档,并使用PHP作为客户端,通过弹性搜索呈现查询结果返回。
如果我能获得一些关于如何从弹性搜索返回的查询结果中找到附加到弹性搜索的PDF的教程的链接,我将不胜感激。
在线搜索无法找到与我想要实现的内容有关的任何教程
答案 0 :(得分:0)
在documentation中,它说Elasticseacrh将附件的内容存储为base64编码。因此,在搜索之后,您可以再次将文档内容作为base64编码。然后,您可以将该内容解码为pdf。例如,检查该线程以了解如何完成:PHP get pdf file from base64 encoded data string