我一直在使用Spark流处理Spark 2.1.0中的数据。
9个接收器通过流传输以10秒的间隔接收数据。 自从我提交流媒体应用程序以来,平均处理时间约为10秒。但是,排队的批次延迟了超过一天。
队列在驱动程序中吗?还是在每个接收者执行器中?
在Active Batch处理中,除9个接收方外,仅处理一个真实数据处理批次。因此,总是只有10个批次在运行。
我在询问如何增加处理数据的活动批次的数量。
并且一次只有一个Streaming Batch作业。我在SparkConf中将spark.scheduler.mode设置为FAIR,并将调度池设置为fair,但是批处理作业一次只能运行一个。
在spark作业调度指南中,公平池应该在同一池中作为FIFO运行。是这样吗?
如何同时运行多个Spark Streaming批处理作业?