除了使用collect之外如何将rdd转换为数组,因为收集操作会花费太多时间?

时间:2015-10-17 07:23:53

标签: apache-spark

收集可能会花费太多时间, 所以我想要一个可以节省时间的操作。 我的rdd只有一个非常小的数组,如果使用collect,它很贵。 而且rdd的类型是RDD [Int,(Array [Array [Double]])],rdd的长度只有1.so谁可以帮帮我?

1 个答案:

答案 0 :(得分:0)

如果长度只有1,那么为什么不尝试rdd.first