我正在学习Apache Spark,对此有较早的疑问。看起来即使对RDD进行排序,它仍然可以根据您的访问方式进行未排序。假设我已经执行过这样的排序:
val someSortedRDD = someUnsortedRDD.map{[some condition]}.sortByKey()
这总是会排序:
someSortedRDD.collect()
但是,即使我以前对此RDD进行了排序,它也会以可能未排序的顺序打印:
someSortedRDD.foreach(println)
因此,我只是想知道是否有一些通用原则可以用来了解何时以排序与未排序的顺序访问RDD。