我们有posts
个数据框。我从questions
衍生出answers
和posts
数据帧,如下所示:
val questions = spark.sql("select * from posts where posts._PostType = 'Question'")
val answers = spark.sql("select * from posts where posts._PostType = 'Answer'")
我需要找到每个帖子的所有答案(_ParentId
的{{1}}栏指向answers
的{{1}}栏)。所以我写了以下
_Id
问题
输出
questions