标签: scala apache-spark dataframe recursion linked-list
我有一个Scala Spark DataFrame,其中每个对象都有一个parent。每个父对象也是一个对象,在其中可以有另一个父对象,依此类推。将不会有环形链接。
parent
object_id, parent_id, 1, 2, 2, 3, 3, NULL,
如何处理数据集以检索对象的所有parent_ids?结果:
parent_ids
object_id, parent_ids, 1, [2, 3], 2, [3], 3, NULL,