标签: apache-spark apache-spark-sql
我正在尝试为分层数据生成闭包表。我有下表:
node | parent ----------------- 1 | 2 | 1 3 | 2 -----------------
我需要生成以下的闭包表:
node | a ----------- 1 | 1 2 | 1 2 | 2 3 | 2 3 | 1 3 | 3 ------------
我知道如何使用递归CTE在RDBMS中执行此操作,但在Apache Spark中寻找解决方案