如何在Spark Streaming中从hdfs读取更新的文件

时间:2019-07-03 10:57:37

标签: apache-spark spark-streaming

我正在运行spark流,并且正在从hdfs位置读取一个文件。同一文件由不同的服务更新。现在,我想在Spark Stream中读取更新的文件。我该如何实现?

1 个答案:

答案 0 :(得分:0)

您尝试了吗?

streamingContext.fileStream[KeyClass, ValueClass, InputFormatClass](dataDirectory)
// or
streamingContext.textFileStream(dataDirectory) // for text file

https://spark.apache.org/docs/latest/streaming-programming-guide.html