如何获得R中每日时间序列的分类频率

时间:2017-12-19 19:25:41

标签: r date time-series time-frequency

我有一个数据框:

data <- data.frame(daytime = c('2005-05-03 11:45:23', '2005-05-03 11:47:45', 
                           '2005-05-03 12:00:32', '2005-05-03 12:25:01',
                           '2006-05-02 10:45:15', '2006-05-02 11:15:14',
                           '2006-05-02 11:16:15', '2006-05-02 11:18:03'),
               category = c("A", "A", "A", "B", "B", "B", "B", "A"))
print(data)

              daytime category    date2
1 2005-05-03 11:45:23        A 05/03/05
2 2005-05-03 11:47:45        A 05/03/05
3 2005-05-03 12:00:32        A 05/03/05
4 2005-05-03 12:25:01        B 05/03/05
5 2006-05-02 10:45:15        B 05/02/06
6 2006-05-02 11:15:14        B 05/02/06
7 2006-05-02 11:16:15        B 05/02/06
8 2006-05-02 11:18:03        A 05/02/06

我想将此数据框转换为每日分类频率的时间序列,如下所示:

         day cat_A_freq cat_B_freq
1 2005-05-01          3          1
2 2005-05-02          1          3

我尝试过:

library(anytime)
data$daytime <- anytime(data$daytime)

data$day <- factor(format(data$daytime, "%D"))
table(data$day, data$category)

           A B
  05/02/06 1 3
  05/03/05 3 1

但是正如您可以看到格式化新变量day一样,会更改日期的外观。您还可以看到表格没有以正确的顺序返回日期(年份不按顺序),以便我可以轻松地转换为时间序列。

有关如何以更简单的方式获取频率的任何想法,或者如果是这样,如何以正确的日期顺序获取频率并进入数据帧以便轻松转换为时间序列对象?

1 个答案:

答案 0 :(得分:1)

使用的解决方案。您数据中daytime列的格式是好的,因此我们可以直接使用as.Date,而无需指定其他格式或使用其他功能。

library(tidyverse)
data2 <- data %>%
  mutate(day = as.Date(daytime)) %>%
  count(day, category) %>%
  spread(category, n)
data2
# # A tibble: 2 x 3
#          day     A     B
# *     <date> <int> <int>
# 1 2005-05-03     3     1
# 2 2006-05-02     1     3