标签: performance apache-spark bigdata spark-ui
对于洗牌动作,我看到由同一执行器的核心处理的数据是不平衡的,当然,执行时间最长的数据会减慢整个处理时间。
所以我想知道是否可以进行一些修改,以便在内核之间平均共享数据。
我在aws emr和s3上使用Spark 2.4。