我在Kafka中有一个主题,我正在使用from_json将JSON消息转换为数据帧,并且我使用结构化流媒体。
val agentStringDF = spark
.readStream
.format("kafka")
.option("subscribe", "testTopic")
.option("startingOffsets" , "latest")
.load()
val df = agentStringDF.select(from_json(col("value").cast("string"), testTopicSchema).alias("testTopic"))
有没有办法用from_json做某种类型的类型,如果它失败了,记录错误并转到下一个微批处理?
我已经看到一旦转换后检查架构的情况..但没有以这种方式检查。