Apache Spark生成用于分层数据的Closure表

时间:2018-02-22 14:04:48

标签: apache-spark apache-spark-sql

我正在尝试为分层数据生成闭包表。我有下表:

node | parent
-----------------
1    | 
2    | 1
3    | 2
-----------------

我需要生成以下的闭包表:

node | a
-----------
1    | 1
2    | 1
2    | 2
3    | 2
3    | 1
3    | 3
------------

我知道如何使用递归CTE在RDBMS中执行此操作,但在Apache Spark中寻找解决方案

0 个答案:

没有答案