用不同的列名称连接不同的数据框

时间:2019-11-11 16:58:45

标签: pyspark databricks

如何将两个包含相同名称的df连接到具有不同列名称的行中。即:

dfSummer =

/ InSummer /  TripsBooked / -- /
Jon        /          3   / -- /
Tyler      /          5   / -- /
Zac        /          6   / -- /

dfWinter =

/ InWinter  / TripsBooked /  --  /
Jon         /       3  /
Tyler       /       5  /
Zac         /       6  /

如何代表两个表以及一年中的总行程。 预先感谢您的时间

1 个答案:

答案 0 :(得分:-1)

final_df = dfSummer.groupBy('InSummer').sum()\
    .join(dfWinter.groupBy('InWinter').sum(), dfSummer.InSummer == dfWinter.InWinter)