我想基于某些条件加入两个表/数据帧。
例如,在一个表格中,我有一列name
在另一个表中,我有列name1
,name2
,name3
当第二个表中的任何名称列匹配时,如何连接列上的表,并按name
name2
name3
的顺序使用列进行加入什么时候可能?
答案 0 :(得分:3)
您可以使用join
将表达式作为条件算法并使用or
(||)
df1.join(df2, $"name" === $"name1" || $"name" === $"name2" || $"name" === $"name3")