如何实现文件搜索功能?

时间:2015-08-22 05:37:53

标签: solr elasticsearch lucene

我正致力于文件搜索引擎功能。我在设计应用程序时需要您的建议。 我使用elastisearch作为框架来实现我的功能。

我的主要功能是根据文件名,文件类型,大小和创建日期启用文件搜索。我还需要根据文件内容启用搜索。

请建议最好的文件来做索引并提取文件数据。

此外,由于可以删除/更新文件,因此我需要在某个时间间隔内再次生成索引,以便如何监视目录中的任何更改。

我使用SAMBA作为我的文件存储系统。

1 个答案:

答案 0 :(得分:1)

要在文件内容中使用搜索选项,您需要将文件索引到elasticsearch索引中。

查看Mapper Attachment插件,这将有助于您索引文件并使其可搜索。

Step01: 将插件安装到您的弹性搜索群集

Step02: 将文件转换为byte []并将其发送到elasticsearch index

Step03: 现在,您可以使用普通查询使用文件内容进行搜索。

注意:这仅适用于基于文本的文件,如pdf,word(doc,docx)&文本文件。如果pdf文件包含图像中的文本,则无法搜索。