Logstash 在所有查询匹配文档中添加新的非现有嵌套字段?

时间:2021-05-16 13:58:02

标签: elasticsearch logstash pipeline logstash-configuration

我使用的是 ELK 7.12。
我的外部json:

{"req-id":"Test9","process-code":"demo9","field1":1,"field2":"abc"}

Elasticsearch 文档:

{"docid":"...", "h":{...},"a":{...}}

预期输出:

{"docid":"...", "h":{...},"a":{...}, "externaldata":{"field1":1,"field2":"abc"}}

Logstash 管道:

filter {
    elasticsearch {
        hosts => "http://localhost:9200/"
        user => elastic
        password => elastic
        index => "demo7"
        query => "h.req-id:%{[req-id]} AND h.process-code:%{[process-code]}"
        docinfo_fields => {
          "_id" => "docid"
        }
    }
    if ("_elasticsearch_lookup_failure" not in [tags]) {
        mutate {
            add_field => {"externaldata"=>{}}
            add_field => { "externaldatafield1" => "%{[field1]}" }
            add_field => { "externaldatafield2" => "%{[field2]}" }
        }
        mutate {
            rename => {
                "externaldatafield1" => "[externaldata][field1]"
                "externaldatafield2" => "[externaldata][field2]"
            }
        }
    }
}
output {
    elasticsearch {
        hosts => "http://localhost:9200/"
        user => elastic
        password => elastic
        index => "demo7"
        action => "update"
        doc_as_upsert => true
        document_id => "%{docid}"
    }
}

错误:

"error"=>{"type"=>"mapper_parsing_exception", "reason"=>"failed to parse field [externaldata] of type [text] in document with id '901'. Preview of field's value: '{field1=1, field2=abcd}'"

我尝试了其他 SO 帖子中的几种组合来在事件中添加嵌套字段,但管道无法执行。请为我提供正确的语法。我的学习参考是this

编辑 1:
根据leandrojmp的评论,GET /demo7/_mapping的结果是:

"externaldata" : {
          "type" : "text",
          "fields" : {
            "keyword" : {
              "type" : "keyword",
              "ignore_above" : 256
            }
          }
        }

在研究映射概念后,我删除了索引并成功地重新执行了管道。

现在的问题是,仅更新了 2 个查询匹配文档中的一个。 如何使用 externaldata 字段更新所有查询匹配文档?如果我应该使用任何循环/跳转代码,请提供参考?

编辑 2:
我原来关于附加字段和映射错误的问题是由leadrojmp解决的;因此接受他们的回答。但是多文档更新问题仍然存在。到目前为止,我明白我们应该使用“http”或“exec”插件而不是“elasticsearch”。

1 个答案:

答案 0 :(得分:0)

此错误意味着您的索引中已有一个文档,其中字段 externaldata 的类型为 text,现在您正尝试将同一字段作为 object 建立索引。< /p>

例如,如果在一个文档中您将 externaldata 作为文本:

{ 
    "externaldata": "some string text value" 
}

在其他文档中,您有 externaldata 作为和对象:

{ 
    "externaldata": {
        "field1": "1",
        "field2": "2"
    }
}

这两个文档中的一个将被拒绝,哪个将取决于您的映射,如果您没有明确应用映射,elasticsearch 将为该字段创建一个映射,其类型为它首先接收的类型,在您的情况下似乎是 text 类型。

要解决此问题,您需要删除索引并为字段 externaldata 应用 mapping 或索引此字段为对象的文档。

映射将是这样的:

{
    "externaldata": {
        "properties: {
            "field1": { "type": "keyword" },
            "field2": { "type": "keyword" }
        }
    }   
} 

如果在您的数据中有文档,该字段不是对象,则需要更改其名称,不能将相同的字段作为字符串和对象。

另外,你的 mutate 过滤器是错误的,你只需要这样的东西:

mutate {
    add_field => { "[externaldata][field1]" => "%{[field1]}" }
    add_field => { "[externaldata][field2]" => "%{[field2]}" }
}