Spark文件流中的零输入速率

时间:2017-03-02 16:01:57

标签: apache-spark spark-streaming

我正在使用textFileStream来传输来自亚马逊s3的数据。它只为第一批输出提供输出。除此之外,Spark UI中的输入速率始终为零。我的问题类似于Spark Streaming: Input Rate and File stream [0] has "Avg: 0.00 events/sec" always

任何帮助都将不胜感激。

感谢。

2 个答案:

答案 0 :(得分:0)

EMR及其s3://或Apache Spark和s3n / s3a客户端?

答案 1 :(得分:0)

我见证了同样的行为。 我的猜测是UI将这些指标基于接收器,因为textFileStream实际上并不是由接收器返回的( " file streams do not require running a receiver" ),数字是(错误的)0。 这是有道理的,因为使用Kafka流时同样的行为是seen,而Kafka流也没有接收器支持。