我可以使用spark 2.3.0和pyspark从Kafka进行流处理吗?

时间:2018-03-02 11:34:39

标签: apache-spark pyspark apache-kafka

我将使用pyspark进行流处理,并使用Kafka作为数据源。

我发现Spark Python API不支持Kafka 0.10连接器。

我可以在Spark 2.3.0中使用Kafka 0.8连接器,不管它是否已被弃用?

1 个答案:

答案 0 :(得分:4)

已弃用,但未删除。你可以使用它。

但是,您可能对结构化流媒体感兴趣,它在Python中支持Kafka 0.10 - 链接here。这是Spark中新的Streaming API,它将取代DStreams