Spark:重写.filter(“ count> 1”),不使用字符串表达式

时间:2019-05-17 08:04:45

标签: java apache-spark dataframe apache-spark-sql

Java中有一段代码:

Dataset<Row> dataset = ...
...
dataset.groupBy("id").count().filter("count > 1");

是否可以使用某些数据框方法(例如"count > 1")来设置filter(count().gt(1))条件?

1 个答案:

答案 0 :(得分:1)

函数“ col”具有比较方法,可以使用它们:

import static org.apache.spark.sql.functions.*;
ds.filter(col("count").$greater(lit(1)))