标签: apache-spark hadoop hdfs
我的火花工作在19:46提交,但是第一阶段从19:07开始,为什么有这么大的差距,所以我在最近2天都面临这个问题,而在2天之前一切正常。
请参阅图片以供参考,
第一步是从Hadoop读取标头(CSV文件)。