如何在Pyspark中将两个数据集合并为一个

时间:2019-10-25 00:39:54

标签: pyspark

假设我们有两个数据集:

数据集1:

id  name    
1   James
2   Tom

数据集2:

id   name
1    Bond
2    Jerry

我希望数据集3具有以下格式

数据集3:

id   name
1    James
2    Tom
3    Bond
4    Jerry

提前谢谢!

1 个答案:

答案 0 :(得分:0)

非常简单

df3 = df1.union(df2)