我有两个数据框,并且我只想检索其中一个数据框的信息,这在内部联接中找不到,请参见图片:
我尝试了几种方法:内部联接和过滤返回至少一个null的行,文档中针对 Spark 1.6 描述的所有联接类型,但无法仅从中获取结果一键。
有人可以帮忙吗?
答案 0 :(得分:0)
这称为排除连接权,您可以在下面进行操作
df1.join(df2,df1("column1")===df2("column2"),"right_outer").filter("column1 is null").show