使用R将时间序列数据划分为工作日和周末数据集

时间:2015-10-13 13:49:09

标签: r time-series

我的数据集由两列(时间戳和功率)组成:

 str(df2)
'data.frame':   720 obs. of  2 variables:
 $ timestamp: POSIXct, format: "2015-08-01 00:00:00" "2015-08-01 01:00:00" " ...
 $ power    : num  124 149 118 167 130 ..

此数据集的持续时间为整整一个月。我想创建它的两个子集 - 一个包含周末数据,另一个包含工作日(周一 - 周五)数据。换句话说,一个数据集应包含与星期六和星期日相对应的数据,另一个数据集应包含其他日期的数据。两个子集都应保留两列。我怎么能在R?中做到这一点?

我尝试使用聚合和拆分的概念,但我不清楚聚合的函数参数(FUN),我应该如何指定数据集的分区。

3 个答案:

答案 0 :(得分:1)

您可以使用R基本函数执行此操作,首先使用strptime将日期数据与第一列分开,然后使用函数weekdays。 例如:

df1<-data.frame(timestamp=c("2015-08-01 00:00:00","2015-10-13 00:00:00"),power=1:2)
df1$day<-strptime(df1[,1], "%Y-%m-%d")
df1$weekday<-weekdays(df1$day)
df1
 timestamp              power   day      weekday
 2015-08-01 00:00:00     1   2015-08-01  Saturday
 2015-10-13 00:00:00     2   2015-10-13  Tuesday

答案 1 :(得分:0)

最初,我尝试使用额外的库进行复杂的方法,但最后,我提出了一个使用R的基本方法。

    #adding day column to existing set 
    df2$day <- weekdays(as.POSIXct(df2$timestamp))    
    # creating two data_subsets, i.e., week_data and weekend_data
    week_data<- data.frame(timestamp=factor(), power= numeric(),day= character())
    weekend_data<- data.frame(timestamp=factor(),power=numeric(),day= character())
    #Specifying weekend days in vector, weekend
    weekend <- c("Saturday","Sunday")
    for(i in 1:nrow(df2)){
      if(is.element(df2[i,3], weekend)){
        weekend_data <- rbind(weekend_data, df2[i,])
      } else{
        week_data <- rbind(week_data, df2[i,])
      }
    }

创建的数据集,即weekend_data和week_data是我所需的子数据集。

答案 2 :(得分:0)

建立在@ShruS示例之上:

df<-data.frame(timestamp=c("2015-08-01 00:00:00","2015-10-13 00:00:00", "2015-10-11 00:00:00", "2015-10-14 00:00:00"))
df$day<-strptime(df[,1], "%Y-%m-%d")
df$weekday<-weekdays(df$day)
df1 = subset(df,df$weekday == "Saturday" | df$weekday == "Sunday")
df2 = subset(df,df$weekday != "Saturday" & df$weekday != "Sunday")

> df
            timestamp        day   weekday
1 2015-08-01 00:00:00 2015-08-01  Saturday
2 2015-10-13 00:00:00 2015-10-13   Tuesday
3 2015-10-11 00:00:00 2015-10-11    Sunday
4 2015-10-14 00:00:00 2015-10-14 Wednesday

> df1
            timestamp        day  weekday
1 2015-08-01 00:00:00 2015-08-01 Saturday
3 2015-10-11 00:00:00 2015-10-11   Sunday

> df2
            timestamp        day   weekday
2 2015-10-13 00:00:00 2015-10-13   Tuesday
4 2015-10-14 00:00:00 2015-10-14 Wednesday