我正在尝试将joinWith
用于 Spark 中的左外部联接。我的代码如下:
private def joinAll: Dataset[(DF1, DF2)] = {
df1.joinWith(df2, df1("column1") <=> df2("column1"), "left_outer")
}
DF2 中的每个值都是一个 Option 。当联接不匹配时,我希望(df1, df2)
上的每个值的df2
为NULL
(或者可以选择None
)。但是,我得到的是(df1, null)
。我是否误解了<=>的工作原理?