递归检索Scala Spark DataFrame中的项目

时间:2019-03-20 09:10:18

标签: scala apache-spark dataframe recursion linked-list

我有一个Scala Spark DataFrame,其中每个对象都有一个parent。每个父对象也是一个对象,在其中可以有另一个父对象,依此类推。将不会有环形链接。

object_id, parent_id,
1, 2,
2, 3,
3, NULL,

如何处理数据集以检索对象的所有parent_ids?结果:

object_id, parent_ids,
1, [2, 3],
2, [3],
3, NULL,

0 个答案:

没有答案