如何按小时对数据进行分组?

时间:2017-04-06 18:21:44

标签: r

我已将我的数据读入R,我试图按小时将数据分组,但代码如下:

tweets <- read.csv("tweetCSV.csv", header = TRUE, sep = ",", stringsAsFactors = FALSE)

tweets %>%
group_by(format(Time, "%H"), Word) %>%
summarise(count=n())

当我运行此代码时,我收到一个错误(如下所示),我无法理解:

  • “mutate_impl(.data,dots)中的错误:无效的'trim'参数”

我想知道是否有人可以帮我解决这个问题?

谢谢James

可以通过以下链接访问数据集示例:https://docs.google.com/spreadsheets/d/1JhXEyzkjPs59hVgoS3lW7e0Fcumis62QDUvuMP2q5aQ/edit?usp=sharing

1 个答案:

答案 0 :(得分:4)

这对我有用:

tweets %>%
    mutate(Time = as.POSIXct(Time)) %>%
    group_by(lubridate::hour(Time), Word) %>%
    summarise(count=n()) %>%
    arrange(desc(count))

将它转换为POSIXct可以让你使用rubridate的小时功能。