什么是scala火花相当于R的子集

时间:2017-04-26 04:24:00

标签: scala apache-spark

假设我在spark中有一个数据框df,结构如此。

输入:

amount city
10000  la
12145  ng
14000  wy
18000  la

如何将数据框子集为量> 10000

预期输出:

amount city
12145  ng
14000  wy
18000  la

在R中,我可以这样做:

df1 <- df[df$amount > 10000 ,]

我知道我可以使用spark的SQL来做同样的事情,但是上面的步骤是什么

1 个答案:

答案 0 :(得分:0)