如何创建AvroDeserialzationSchema并在Flink Kafka Consumer中使用?

时间:2018-08-20 02:30:50

标签: apache-flink avro-tools

我正在尝试为kafka avro序列化主题创建flink使用者。 我有kafka主题流式Avro序列化数据。我可以通过avroconsole消费者看到它。

Flink 1.6.0添加了一个AvroDeserializationSchema,但是我找不到其用法的完整示例。是的,在1.6.0之前,有一些类会生成avrodeserialization类。

我有一个通过avro工具生成的avro类。

现在,我一直在尝试遵循现有的示例,但它们之间的差异足以使我无法解决问题。 (我通常不使用Java编程)

大多数使用以下形式

Myclass mc = new MyClass();
AvroDeserializationSchema<Myclass> ads = new AvroDeserializationSchema<> (Myclass.class);
FlinkKafkaConsumer010<Myclass> kc = new FlinkKafkaConsumer010<>(topic,ads,properties);

其中,Myclass是通过avro-tools jar生成的avro类。这是正确的方法吗?在执行此操作并利用内部flink 1.6.0 avrodeserializationschema类时,我遇到了一些私有/公共访问问题。我是否必须创建一个新类并扩展avrodeserializationschema?

1 个答案:

答案 0 :(得分:0)

好的,我深入研究了kafka消费者javadocs,并找到了一个使用avro流的示例。我仍然必须将kafka消耗量转换为flinkKafkaConsumer,但是下面的代码有效。

要使io.confluent引用正常工作,我必须添加一个存储库和对pom文件的依赖项。

<repository>
  <id>confluent</id>
    <url>http://packages.confluent.io/maven/</url>
</repository>

<dependency>
    <groupId>io.confluent</groupId>
    <artifactId>kafka-avro-serializer</artifactId>
    <version>3.1.1</version>
</dependency>




public class StreamingJob {

//  static  DeserializationSchema<pendingsv> avroSchema = new AvroDeserializationSchema<pendingsv>(pendingsv.class);
    public static void main(String[] args) throws Exception {
        // set up the streaming execution environment
        final StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();

        Properties props = new Properties();
        props.put(ConsumerConfig.BOOTSTRAP_SERVERS_CONFIG, "localhost:9092");
        props.put(ConsumerConfig.GROUP_ID_CONFIG, "opssupport.alarms");
        props.put(ConsumerConfig.KEY_DESERIALIZER_CLASS_CONFIG, "org.apache.kafka.common.serialization.StringDeserializer");
        props.put(ConsumerConfig.VALUE_DESERIALIZER_CLASS_CONFIG, "io.confluent.kafka.serializers.KafkaAvroDeserializer");
        props.put("schema.registry.url", "http://localhost:8081");
        props.put(ConsumerConfig.AUTO_OFFSET_RESET_CONFIG, "earliest");
        String topic = "pendingSVs_";
        final Consumer<String, GenericRecord> consumer = new KafkaConsumer<String, GenericRecord>(props);
        consumer.subscribe(Arrays.asList(topic));

        try {
            while (true) {
                ConsumerRecords<String, GenericRecord> records = consumer.poll(100);
                for (ConsumerRecord<String, GenericRecord> record : records) {
                    System.out.printf("offset = %d, key = %s, value = %s \n", record.offset(), record.key(), record.value());
                }
            }
        } finally {
            consumer.close();
        }


    // execute program
    //env.execute("Flink Streaming Java API Skeleton");
}

}