我已将我的数据读入R,我试图按小时将数据分组,但代码如下:
tweets <- read.csv("tweetCSV.csv", header = TRUE, sep = ",", stringsAsFactors = FALSE)
tweets %>%
group_by(format(Time, "%H"), Word) %>%
summarise(count=n())
当我运行此代码时,我收到一个错误(如下所示),我无法理解:
我想知道是否有人可以帮我解决这个问题?
谢谢James
可以通过以下链接访问数据集示例:https://docs.google.com/spreadsheets/d/1JhXEyzkjPs59hVgoS3lW7e0Fcumis62QDUvuMP2q5aQ/edit?usp=sharing
答案 0 :(得分:4)
这对我有用:
tweets %>%
mutate(Time = as.POSIXct(Time)) %>%
group_by(lubridate::hour(Time), Word) %>%
summarise(count=n()) %>%
arrange(desc(count))
将它转换为POSIXct可以让你使用rubridate的小时功能。