最近我一直在Spark Streaming上进行性能测试。但是有些问题让我困惑不已 在Spark Streaming中,接收器计划在工作节点上的执行程序中运行。
答案 0 :(得分:2)
每DStream
只有一个接收者,但您可以将多个DStream
和union
一起创建为一个接收者。这就是为什么建议对至少Spark Streaming
(接收器)+ 1个核心的集群运行N
的原因。一旦数据通过接收部分,它主要是一个简单的Spark
应用程序,并遵循批处理作业的相同规则。 (这就是流式传输称为微批处理的原因)