Logstash输出不正确

时间:2016-05-02 10:40:45

标签: json logstash

我是logstash和elasticsearch的新手。我使用logstash读取数据库更新并存储到elasticsearch中以便快速搜索。以下是我的logstash配置文件(countries.conf)。

    input {
      jdbc {
        jdbc_driver_library => "/home/vagrant/postgresql-9.4-1201.jdbc4.jar"
        jdbc_driver_class => "org.postgresql.Driver"
        jdbc_connection_string => "jdbc:postgresql://192.168.10.123:5432/myDB"
        jdbc_user => "myuser"
        jdbc_password => "mypassword"
        schedule => "* * * * *"
        statement_filepath => "/home/vagrant/countries.sql"
        last_run_metadata_path => "/home/vagrant/logstash/countries.log"
      }
    }
    output {
        elasticsearch {
            index => "myIndex"
            document_type => "countries"
            document_id => "%{id}"
            hosts => "localhost:9200"
        }
        stdout { codec => json_lines }
    }

我的countries.sql文件如下

  SELECT json.id as id,
    row_to_json(json.*) AS _source
   FROM (
        SELECT id, created, modified, name, capital, iso_alpha2, iso_alpha3 
        FROM countries
  ) as json

我使用以下命令运行配置文件

sudo /opt/logstash/bin/logstash -f /home/vagrant/countries.conf

在stdout上输出上述命令如下: -

Settings: Default pipeline workers: 1
Pipeline main started
{"_id":6,"_source":{"type":"json","value":"{\"id\":6,\"created\":\"2013-02-07T10:11:00\",\"modified\":\"2016-04-29T11:15:40.329\",\"name\":\"Andorra\",\"capital\":\"Andorra la Vella\",\"iso_alpha2\":\"AD\",\"iso_alpha3\":\"AND\"}"},"@version":"1","@timestamp":"2016-05-02T10:08:00.931Z"}

正如您在上面的输出中所看到的,_source字段中的json字符串已更改。理想情况下应该如下所示

{"_id":6,"_source":{\"id\":6,\"created\":\"2013-02-07T10:11:00\",\"modified\":\"2016-04-29T11:15:40.329\",\"name\":\"Andorra\",\"capital\":\"Andorra la Vella\",\"iso_alpha2\":\"AD\",\"iso_alpha3\":\"AND\"},"@version":"1","@timestamp":"2016-05-02T10:08:00.931Z"}

Logstash正在改变我的json字符串。它正在添加类型:" json" 一个额外的字段,并在字段中添加我的实际json sting。我越过了检查数据库。我的SQL查询正确地以我需要的格式返回json字符串。

有人可以让我知道我错过了什么吗?或者可以指导我朝正确的方向发展?

提前致谢!

1 个答案:

答案 0 :(得分:0)

检查elasticsearch中的日志。我认为主要是因为你在stdout中使用codec => json_lines,这就是type=>json被追加的原因。 Elasticsearch记录没有类型字段。

如果elasticsearch中的日志也有type => json,请使用mutate删除该字段。

filter {
  mutate {
    remove_field => [ "type" ]
  }
}