Question

说我有一个数据框df1，它的一列是“ city”。

我需要创建一个新列，该列基本上将列出特定城市名称在第二个数据框df2中出现的次数。

谢谢！

Answer 1

var df3 =df2.groupBy("city").count

df1.join(df3,Seq("city"), "left")

这将为您提供答案。这里的join用作查找技术