我正在使用onStageCompleted
中的SparkListener
,试图从accumulables
中挖掘出一些有用的数据。
我有兴趣找出用于监视目的的输出大小。 输入行数和字节可以从第一阶段的“ internal.metrics.input.recordsRead ”和“ internal.metrics.shuffle.write.bytesWritten ”中获取,从我倒数第二个阶段的“ internal.metrics.shuffle.write.recordsWritten ”中可以找到输出行数,我不知道如何找到输出字节。
解压缩或压缩也是我的一个选择。我正在使用Spark 2.10。