我知道以下所述的scala中存在一种方法。
val joined_df = df1.join(broadcast(df2), "key")
如何使用Java进行广播连接。 我必须做sc.broadcast(df2)并在联接中使用它吗?会被称为广播加入吗?
答案 0 :(得分:0)
如何使用Java进行广播连接。
完全一样。
import static org.apache.spark.sql.functions.broadcast;
Datset<Row> joined = df1.join(broadcast(df2), "key");