结构化流式传输中的模式检查

时间:2018-06-08 15:12:49

标签: apache-spark apache-kafka spark-structured-streaming

我在Kafka中有一个主题,我正在使用from_json将JSON消息转换为数据帧,并且我使用结构化流媒体。

val agentStringDF = spark
      .readStream
      .format("kafka")
      .option("subscribe", "testTopic")
      .option("startingOffsets" , "latest")
      .load()

val df = agentStringDF.select(from_json(col("value").cast("string"), testTopicSchema).alias("testTopic"))

有没有办法用from_json做某种类型的类型,如果它失败了,记录错误并转到下一个微批处理?

我已经看到一旦转换后检查架构的情况..但没有以这种方式检查。

0 个答案:

没有答案