在AWS Elasticsearch中为pdf文件编制索引

时间:2018-08-26 17:40:57

标签: amazon-web-services pdf elasticsearch indexing

我想索引一些样本pdf,然后在这些pdf中搜索关键字。我尝试在本地桌面上使用弹性搜索,并使用fscrawler为pdf编制索引。但是我的主要目的是创建一个Web应用程序,在其中可以上传pdf,然后输入搜索字词。我已经在AWS上创建了Elasticsearch集群,但无法弄清楚如何在AWS中索引pdf。我可以将pdf存储在S3上,然后对其进行索引吗?

1 个答案:

答案 0 :(得分:0)

将来我希望支持将S3作为FS实现。参见https://github.com/dadoonet/fscrawler/issues/263

话虽这么说,我相信Workplace Search会在某个时候支持它。