Question

我已将我的数据读入R，我试图按小时将数据分组，但代码如下：

tweets <- read.csv("tweetCSV.csv", header = TRUE, sep = ",", stringsAsFactors = FALSE)

tweets %>%
group_by(format(Time, "%H"), Word) %>%
summarise(count=n())

当我运行此代码时，我收到一个错误（如下所示），我无法理解：

“mutate_impl（.data，dots）中的错误：无效的'trim'参数”

我想知道是否有人可以帮我解决这个问题？

谢谢James

可以通过以下链接访问数据集示例：https://docs.google.com/spreadsheets/d/1JhXEyzkjPs59hVgoS3lW7e0Fcumis62QDUvuMP2q5aQ/edit?usp=sharing

Answer 1

这对我有用：

tweets %>%
    mutate(Time = as.POSIXct(Time)) %>%
    group_by(lubridate::hour(Time), Word) %>%
    summarise(count=n()) %>%
    arrange(desc(count))

将它转换为POSIXct可以让你使用rubridate的小时功能。

如何按小时对数据进行分组？

1 个答案: