我正在尝试映射openNLP以启用文档中的字段解析。使用以下代码:
"article":
"properties":
"content" : { "type" : "opennlp" }
在创建映射之前,我从sourceforge.net
下载了命名实体提取二进制文件,并使用elasticsearch
插件文件夹中的cURL安装/解压缩。
当我尝试运行上面的映射代码时,收到以下错误消息。
“error”:“MapperParsingException [没有类型[opennlp]的处理程序 在字段[内容]]上声明“”状态“:400
答案 0 :(得分:0)
快速搜索谷歌后,我发现了这个:https://github.com/spinscale/elasticsearch-opennlp-plugin
我假设您正在尝试安装它。但是 - 它已经过时,甚至可能都不受最近的Elasticsearch版本的支持。
它的目的似乎是从文件中提取数据并将它们作为标记索引。 Elasticsearch Mapper Attachments Type插件就是这么做的。我鼓励你使用它而不是OnenNLP。从文档中快速摘录:
映射器附件插件会将附件类型添加到 Elasticsearch使用Apache Tika。附件类型允许索引 不同的“附件”类型字段(编码为base64),例如, microsoft office格式,打开文档格式,ePub,HTML等 (可以找到完整列表here)。
如何使用地图字段的示例:
PUT /test/person/_mapping
{
"person" : {
"properties" : {
"my_attachment" : {
"type" : "attachment"
}
}
}
}