我正在尝试从已经序列化为Avro的Kafka主题中使用内容,并且需要弄清楚从Spark Structure Streaming应用程序中使用时如何反序列化它。
请注意,我需要使用Python的解决方案
spark = SparkSession\
.builder\
.appName("De-Serializing ")\
.getOrCreate()
data = spark.readStream\
.format("kafka")\
.option("kafka.bootstrap.servers", "kafkahost:9092")\
.option("subscribe", "my_topic")\
.option("startingOffsets", "earliest")\
.load()
# Do Stuff here
query = data.writeStream\
.outputMode("append")\
.format("console")\
.option("truncate", "false")\
.trigger(processingTime="5 seconds")\
.start()\
.awaitTermination()
有人可以帮助我吗?