连续处理模式和python udf

时间:2019-03-08 22:09:36

标签: apache-spark pyspark spark-streaming spark-structured-streaming spark-streaming-kafka

Spark 2.4.0是否支持具有连续处理模式的Python UDF?

在我的简单代码中,我使用的是kafka主题,每行进行一些琐碎的处理(基本上在json消息中添加一个虚拟字段)并写出另一个主题。

但是,当我使用连续模式触发时,我在输出主题中看不到任何消息。如果我不使用python udf,那么它将正常工作。

编辑:此bug report(与该帖子无关)报告缺乏支持。

1 个答案:

答案 0 :(得分:0)

尽管我还没有尝试过自己,但我相信没有。 documentation列出了支持的操作; udfs不在列表中。