我有两列数据:
DateTime Profit
20130319T01 5
20130319T02 135
20130319T03 245
20130320T01 10
20130320T02 115
我想创建一个每小时都有差异的列,但问题是每天Profit重置为零。我想得到以下内容:
DateTime Diff
20130319T01 5
20130319T02 130
20130319T03 110
20130320T01 10
20130320T02 105
答案 0 :(得分:4)
假设您的DateTime字符向量的格式始终为"YYYYMMDD"
,那么您可以使用ddply
中的plyr
函数来获得您想要的内容:
require(plyr)
df$Date <- substr( df$DateTime , 1 , 8 )
ddply( df , .(Date) , summarise , Diff = diff(c(0,Profit)) )
# Date Diff
#1 20130319 5
#2 20130319 130
#3 20130319 110
#4 20130320 10
#5 20130320 105
使用base ave
的另一种方式:
within(df, { Profit_diff <- ave(Profit, list(gsub("T.*$", "", DateTime)),
FUN=function(x) c(x[1], diff(x)))})
# DateTime Profit Profit_diff
# 1 20130319T01 5 5
# 2 20130319T02 135 130
# 3 20130319T03 245 110
# 4 20130320T01 10 10
# 5 20130320T02 115 105