如何优化Spark RDD操作循环?

时间:2017-03-20 09:29:14

标签: java apache-spark

如何优化循环中执行的RDD操作?

例如:

  for(String x:mycollection) {
//Perform something on RDD with x
}
  

问题:

上面的代码依次对每个元素执行RDD操作,即使每个集合项都没有依赖。

这可以优化以并行执行每个元素的RDD操作吗?

Java反思在这方面有帮助吗?

0 个答案:

没有答案