我尝试按特定列对数据框进行分组:
>SparkR::agg(SparkR::groupBy(df, "column_1"))
为什么会出现以下错误:
Error: length(cols) > 0 is not TRUE
答案 0 :(得分:0)
我发现这种错误(see also this one)与提供给函数的参数有关(这里是:agg)。我错过了指定输出列:
SparkR::agg(SparkR::groupBy(df, "column_1"), "column_1")