如何在ddply中使用函数循环

时间:2014-02-26 16:10:00

标签: r loops plyr

我想在一些固定时间事件(事件数量= 108)中发生这些时差时,为14个不同的用户总结一列时差diff。 这里是第一个数据帧的头部,带有时间差'diff`,这个数据帧包含152171行:

head(hope)
                times        users signal mode diff
1 2014-01-13 00:00:16 00250902DC7D   true   ON   31
2 2014-01-13 00:00:47 00250902DC7D   true   ON   31
3 2014-01-13 00:01:18 00250902DC7D   true   ON   30
4 2014-01-13 00:01:48 00250902DC7D   true   ON   31
5 2014-01-13 00:02:19 00250902DC7D   true   ON   31
6 2014-01-13 00:02:50 00250902DC7D   true   ON   31 

具有108个不同时间范围(nrow = 108)的第二个数据帧是:

head(events)
          start                 end
1 2014-01-14 06:30:00 2014-01-14 07:00:00
2 2014-01-14 10:30:00 2014-01-14 11:00:00
3 2014-01-14 18:00:00 2014-01-14 18:30:00
4 2014-01-14 22:30:00 2014-01-14 22:59:00
5 2014-01-15 02:30:00 2014-01-15 02:59:00
6 2014-01-15 09:00:00 2014-01-15 09:30:00  

如果我手动选择一个事件(我偶然选择了第12个事件......),我可以计算第12个事件中的时差(diff)并且它有效......但我有108个不同的事件...

hope1 <- hope[hope$mode=="ON" & hope$times>events[12,1] & hope$times<events[12,2],]
ddply(hope1,.(users),summarize,sum=sum(diff))  
         users  sum
1 00250902DC7D 1857
2 00250902FA92 1857
3 00250902FB05 1857
4 002509030C41 1857
5 002509030E53 1857  

* 确定完美,但仅限一次 *

如果我想为108个不同的事件做这件事,我应该使用循环吗?

我尝试过类似下面的代码,但我/它失败了......:

> for (i in 1:108)
+ hope5 <- data.frame(hope[hope$mode=="ON" & hope$times>events[i,1] & hope$times<events[i,2],])  
ddply(hope5,.(users),summarize,sum=sum(diff))
你能帮帮我吗?

我想得到像这样的输出:

> pippo

                   00250902DC7D 00250902FA92 00250902FB05
2014-01-14 06:30:00           35           32          335
2014-01-14 10:30:00           38           31          338
2014-01-14 18:00:00           49           29          429
2014-01-14 22:30:00           48          438           48
2014-01-15 02:30:00           29           29          289

1 个答案:

答案 0 :(得分:1)

您可以使用listlapply

hopeN <- lapply(1:nrow(events), function(i) hope[hope$mode=="ON" & hope$times>events[i,1] & hope$times<events[i,2],])

result <- lapply(1:length(hopeN), function(i) ddply(hopeN[[i]],.(users),summarize,sum=sum(diff)))

结果是data.frames

的列表