2个不同数据框的绑定列会触发

时间:2019-05-17 13:36:46

标签: scala apache-spark dataframe apache-spark-sql

我在spark中有2个不同的数据框,我想将它们的列绑定以形成唯一的数据框。如何使用Spark Scala进行操作?
谢谢

1 个答案:

答案 0 :(得分:1)

听起来您想加入两个数据框。

要执行此操作,您需要有一个键,用于将(一个)行的列与另一个行的列绑定(连接)。您可以在这里找到更多信息:https://www.waitingforcode.com/apache-spark-sql/join-types-spark-sql/read

myDataframe
  .join(otherDataframe, col("x") === col("y"))