我是logstash和elasticsearch的新手。我使用logstash读取数据库更新并存储到elasticsearch中以便快速搜索。以下是我的logstash配置文件(countries.conf)。
input {
jdbc {
jdbc_driver_library => "/home/vagrant/postgresql-9.4-1201.jdbc4.jar"
jdbc_driver_class => "org.postgresql.Driver"
jdbc_connection_string => "jdbc:postgresql://192.168.10.123:5432/myDB"
jdbc_user => "myuser"
jdbc_password => "mypassword"
schedule => "* * * * *"
statement_filepath => "/home/vagrant/countries.sql"
last_run_metadata_path => "/home/vagrant/logstash/countries.log"
}
}
output {
elasticsearch {
index => "myIndex"
document_type => "countries"
document_id => "%{id}"
hosts => "localhost:9200"
}
stdout { codec => json_lines }
}
我的countries.sql文件如下
SELECT json.id as id,
row_to_json(json.*) AS _source
FROM (
SELECT id, created, modified, name, capital, iso_alpha2, iso_alpha3
FROM countries
) as json
我使用以下命令运行配置文件
sudo /opt/logstash/bin/logstash -f /home/vagrant/countries.conf
在stdout上输出上述命令如下: -
Settings: Default pipeline workers: 1
Pipeline main started
{"_id":6,"_source":{"type":"json","value":"{\"id\":6,\"created\":\"2013-02-07T10:11:00\",\"modified\":\"2016-04-29T11:15:40.329\",\"name\":\"Andorra\",\"capital\":\"Andorra la Vella\",\"iso_alpha2\":\"AD\",\"iso_alpha3\":\"AND\"}"},"@version":"1","@timestamp":"2016-05-02T10:08:00.931Z"}
正如您在上面的输出中所看到的,_source字段中的json字符串已更改。理想情况下应该如下所示
{"_id":6,"_source":{\"id\":6,\"created\":\"2013-02-07T10:11:00\",\"modified\":\"2016-04-29T11:15:40.329\",\"name\":\"Andorra\",\"capital\":\"Andorra la Vella\",\"iso_alpha2\":\"AD\",\"iso_alpha3\":\"AND\"},"@version":"1","@timestamp":"2016-05-02T10:08:00.931Z"}
Logstash正在改变我的json字符串。它正在添加类型:" json" 一个额外的字段,并在值字段中添加我的实际json sting。我越过了检查数据库。我的SQL查询正确地以我需要的格式返回json字符串。
有人可以让我知道我错过了什么吗?或者可以指导我朝正确的方向发展?
提前致谢!
答案 0 :(得分:0)
检查elasticsearch中的日志。我认为主要是因为你在stdout中使用codec => json_lines
,这就是type=>json
被追加的原因。 Elasticsearch记录没有类型字段。
如果elasticsearch中的日志也有type => json,请使用mutate删除该字段。
filter {
mutate {
remove_field => [ "type" ]
}
}