SparkR截然不同(在数据库上)

时间:2018-03-15 11:20:23

标签: r apache-spark sparkr

我是SparkR的新手,所以请原谅我的问题是否非常基本。

我在databricks上工作并尝试获取SparkDataFrame列的所有唯一日期。

当我跑步时:

uniquedays <- SparkR::distinct(df$datadate)

我收到错误消息:

unable to find an inherited method for function ‘distinct’ for signature ‘"Column"’

Stack Overflow上,我发现这通常意味着 (如果我运行isS4(df),则返回TRUE):

  

这是在尝试将S4泛型函数应用于没有定义S4方法的类的对象时将获得的消息类型

我也尝试过运行

uniquedays <- SparkR::unique(df$datadate)

我收到错误消息:

unique() applies only to vectors

感觉就像,我在这里缺少一些基本的东西。 谢谢你的帮助!

1 个答案:

答案 0 :(得分:0)

试试这个:

library(magrittr)
uniquedays <- SparkR::select(df, df$datadate) %>% SparkR::distinct()