标签: java apache-spark
如何优化循环中执行的RDD操作?
例如:
for(String x:mycollection) { //Perform something on RDD with x }
问题:
上面的代码依次对每个元素执行RDD操作,即使每个集合项都没有依赖。
这可以优化以并行执行每个元素的RDD操作吗?
Java反思在这方面有帮助吗?