我使用的是 ELK 7.12。
我的外部json:
{"req-id":"Test9","process-code":"demo9","field1":1,"field2":"abc"}
Elasticsearch 文档:
{"docid":"...", "h":{...},"a":{...}}
预期输出:
{"docid":"...", "h":{...},"a":{...}, "externaldata":{"field1":1,"field2":"abc"}}
Logstash 管道:
filter {
elasticsearch {
hosts => "http://localhost:9200/"
user => elastic
password => elastic
index => "demo7"
query => "h.req-id:%{[req-id]} AND h.process-code:%{[process-code]}"
docinfo_fields => {
"_id" => "docid"
}
}
if ("_elasticsearch_lookup_failure" not in [tags]) {
mutate {
add_field => {"externaldata"=>{}}
add_field => { "externaldatafield1" => "%{[field1]}" }
add_field => { "externaldatafield2" => "%{[field2]}" }
}
mutate {
rename => {
"externaldatafield1" => "[externaldata][field1]"
"externaldatafield2" => "[externaldata][field2]"
}
}
}
}
output {
elasticsearch {
hosts => "http://localhost:9200/"
user => elastic
password => elastic
index => "demo7"
action => "update"
doc_as_upsert => true
document_id => "%{docid}"
}
}
错误:
"error"=>{"type"=>"mapper_parsing_exception", "reason"=>"failed to parse field [externaldata] of type [text] in document with id '901'. Preview of field's value: '{field1=1, field2=abcd}'"
我尝试了其他 SO 帖子中的几种组合来在事件中添加嵌套字段,但管道无法执行。请为我提供正确的语法。我的学习参考是this。
编辑 1:
根据leandrojmp的评论,GET /demo7/_mapping
的结果是:
"externaldata" : {
"type" : "text",
"fields" : {
"keyword" : {
"type" : "keyword",
"ignore_above" : 256
}
}
}
在研究映射概念后,我删除了索引并成功地重新执行了管道。
现在的问题是,仅更新了 2 个查询匹配文档中的一个。
如何使用 externaldata
字段更新所有查询匹配文档?如果我应该使用任何循环/跳转代码,请提供参考?
编辑 2:
我原来关于附加字段和映射错误的问题是由leadrojmp解决的;因此接受他们的回答。但是多文档更新问题仍然存在。到目前为止,我明白我们应该使用“http”或“exec”插件而不是“elasticsearch”。
答案 0 :(得分:0)
此错误意味着您的索引中已有一个文档,其中字段 externaldata
的类型为 text
,现在您正尝试将同一字段作为 object
建立索引。< /p>
例如,如果在一个文档中您将 externaldata
作为文本:
{
"externaldata": "some string text value"
}
在其他文档中,您有 externaldata
作为和对象:
{
"externaldata": {
"field1": "1",
"field2": "2"
}
}
这两个文档中的一个将被拒绝,哪个将取决于您的映射,如果您没有明确应用映射,elasticsearch 将为该字段创建一个映射,其类型为它首先接收的类型,在您的情况下似乎是 text
类型。
要解决此问题,您需要删除索引并为字段 externaldata
应用 mapping 或索引此字段为对象的文档。
映射将是这样的:
{
"externaldata": {
"properties: {
"field1": { "type": "keyword" },
"field2": { "type": "keyword" }
}
}
}
如果在您的数据中有文档,该字段不是对象,则需要更改其名称,不能将相同的字段作为字符串和对象。
另外,你的 mutate 过滤器是错误的,你只需要这样的东西:
mutate {
add_field => { "[externaldata][field1]" => "%{[field1]}" }
add_field => { "[externaldata][field2]" => "%{[field2]}" }
}