我正在探索Spark的全阶段Java代码生成功能,并注意到那里有几个组件。有一个执行引擎和一个编译器。
您能澄清所有组件之间的关系吗?我认识到的运动部件是:
这些是今天的标准吗?我还没有提到其他任何部分吗?
Spark与这些组件之间的执行流程以及它们之间的组件是什么?
答案 0 :(得分:3)
查询"流程"是:
请注意"催化剂"是作为一个树操作框架创建的,现在我们经常说" Catalyst"对于整个优化器。此外,Tungsten只是一个开发了一些功能的项目,但现在我们说使用Tungsten功能的执行引擎称为Tungsten