IgniteRDD的过滤是在Spark Application或Ignite Server中本地进行的?

时间:2018-01-20 19:17:03

标签: apache-spark ignite

如果我在IgniteRDD上执行过滤器,那么过滤器会被下推到Ignite Server,或者首先Spark RDD应首先收集所有数据,然后在Spark Application中执行过滤器?

2 个答案:

答案 0 :(得分:1)

根本没有collect,但据我所知,案件之间有区别:

  • 普通filter将使用标准的Spark执行。
  • sql将由Ignite自行处理而不使用Spark。

答案 1 :(得分:-2)

这完全取决于Catalyst Optimizer。您可以检查计划以了解您的管道并查看它的执行位置。调试也可能有所帮助。

正如它解释here - IgniteRDD是Spark RDD的一个实现,用于表示Ignite缓存并使用spark API。例如,显示 - 过滤器将直接在缓存上运行。