如何从累积每日数据R获得每小时差异

时间:2013-05-03 10:23:33

标签: r

我有两列数据:

DateTime    Profit
20130319T01  5
20130319T02  135
20130319T03  245
20130320T01  10
20130320T02  115

我想创建一个每小时都有差异的列,但问题是每天Profit重置为零。我想得到以下内容:

DateTime     Diff
20130319T01  5
20130319T02  130
20130319T03  110
20130320T01  10
20130320T02  105

1 个答案:

答案 0 :(得分:4)

假设您的DateTime字符向量的格式始终为"YYYYMMDD",那么您可以使用ddply中的plyr函数来获得您想要的内容:

require(plyr)
df$Date <- substr( df$DateTime , 1 , 8 )
ddply( df ,  .(Date)  , summarise , Diff = diff(c(0,Profit)) )
#     Date Diff
#1 20130319    5
#2 20130319  130
#3 20130319  110
#4 20130320   10
#5 20130320  105

使用base ave的另一种方式:

within(df, { Profit_diff <- ave(Profit, list(gsub("T.*$", "", DateTime)), 
             FUN=function(x) c(x[1], diff(x)))})

#      DateTime Profit Profit_diff
# 1 20130319T01      5           5
# 2 20130319T02    135         130
# 3 20130319T03    245         110
# 4 20130320T01     10          10
# 5 20130320T02    115         105