标签: scala apache-spark dataframe
说我有一个数据框df1,它的一列是“ city”。
我需要创建一个新列,该列基本上将列出特定城市名称在第二个数据框df2中出现的次数。
谢谢!
答案 0 :(得分:0)
var df3 =df2.groupBy("city").count df1.join(df3,Seq("city"), "left")
这将为您提供答案。这里的join用作查找技术