我是SparkR的新手,所以请原谅我的问题是否非常基本。
我在databricks上工作并尝试获取SparkDataFrame列的所有唯一日期。
当我跑步时:
uniquedays <- SparkR::distinct(df$datadate)
我收到错误消息:
unable to find an inherited method for function ‘distinct’ for signature ‘"Column"’
在Stack Overflow上,我发现这通常意味着 (如果我运行isS4(df),则返回TRUE):
这是在尝试将S4泛型函数应用于没有定义S4方法的类的对象时将获得的消息类型
我也尝试过运行
uniquedays <- SparkR::unique(df$datadate)
我收到错误消息:
unique() applies only to vectors
感觉就像,我在这里缺少一些基本的东西。 谢谢你的帮助!
答案 0 :(得分:0)
试试这个:
library(magrittr)
uniquedays <- SparkR::select(df, df$datadate) %>% SparkR::distinct()