我们有一项要求,即我们必须使用ElasticSearch执行全文搜索。我们有一个基于Spring的应用程序,为了与ES集成,我们可以使用Elastic Search的Java API或ElasticSearch的Spring Data。
输入的文件类型大小约为5MB。
我查看了ES Java API和SpringData的示例,他们确实有 可用于插入JSON文档的教程。
但是有关使用File作为创建文档/索引的输入的任何帮助都不可用。
我是Elastic Search的新手,对此的任何指导/帮助将不胜感激。
编辑:
我可以看到ES中有一个Ingest Attachment Processor插件(https://www.elastic.co/guide/en/elasticsearch/plugins/master/ingest-attachment.html)。
任何人都可以指向我使用此插件或任何Java代码使用此插件的示例CURL请求
答案 0 :(得分:3)
1.您可以使用 Elasticsearch映射器附件插件。这个插件使用Apache Tika来摄取几乎所有已知类型的文档,并使其可以被Elasticsearch搜索。
https://www.elastic.co/guide/en/elasticsearch/plugins/2.3/mapper-attachments.html
2.您可以使用 Apache Tika 从文件中提取有用内容,并使用elasticsearch Bulk Indexing api索引到ES
希望有所帮助