Elastic仅保留Logstash的最后一条记录

时间:2018-06-29 09:50:10

标签: elasticsearch logstash logstash-jdbc

这是一条select语句,它是一个事务数据,每当将数据插入到UserProfile中时,旧索引值就会从elastic中删除

  jdbc {
    statement => "SELECT userId,salesTeam FROM UserProfile with (nolock)"
}
output {
    elasticsearch {
    hosts => ["localhost:9200"]
    index => "q_d"
    document_type => "cd"
    document_id => "%{userId}%"
  }
  stdout { codec => rubydebug }
}

如果有任何更改,我想更新现有文档,否则为新文档编制索引。
我在这里做什么错了?

1 个答案:

答案 0 :(得分:1)

input {
    jdbc {
        # Postgres jdbc connection string to our database, mydb
        jdbc_connection_string => "jdbc:postgresql://localhost:5432/bhavya"
        # The user we wish to execute our statement as
        jdbc_user => "postgres"
        # The path to our downloaded jdbc driver
        jdbc_driver_library => "/root/postgresql-42.2.2.jar"
        # The name of the driver class for Postgresql
        jdbc_driver_class => "org.postgresql.Driver"
        jdbc_password => "postgres"
        jdbc_validate_connection => true
        #You can schedule input from this plugin,the following uses cron syntax
        schedule => "* * * * *"
        # our query
        statement => "SELECT uid,email,first_name,last_name FROM contacts"
    }
}

output {
    elasticsearch {
    hosts => ["localhost:9200"]
    index => "contacts"
    document_type => "record"
    document_id => "%{uid}"
  }
  stdout { codec => rubydebug }
}

首先,您应该根据您的数据库添加以上我在输入插件中指定的选项。我使用Postgresql作为数据库。因此,您需要为该数据库下载相应的驱动程序库jar,并指定与之对应的路径。

第二,您应该在“ jdbc”插件中使用计划选项,以便它定期从数据库读取数据。

第三,您应该从“输出”插件部分的“ document_id”部分中删除一个额外的“%”。

您应该参考此页面以从数据库将数据导入logstash :->

https://www.elastic.co/blog/logstash-jdbc-input-plugin