左联接选择重复键

时间:2020-02-07 20:16:05

标签: apache-spark-sql

销售数据框:

transaction_id, name, customer_id, amount

客户数据框:

customer_id, customer_name

我想对Sales Dataframe执行左联接,然后对Sales data frame行执行一些转换,缺少cusomter_id。但是,当我这样做时,

sales.join(customer,Seq(“ customer_id”),“ left_join”)。select(customer(“ cusomter_id”))

我仍然感到模棱两可,我也尝试使用Alias,但是失败了,有没有更好的方法来做同样的事情?

0 个答案:

没有答案