我正在使用padr 0.3.0填写服务器统计信息的任何缺失时间戳,并且效果很好。我目前只按时间戳填充。
我的问题是,如果我想填写“timestamp”和另一个我称之为“diskname”的字段,我可以同时执行此操作吗?
为了论证,我们假设每个时间间隔有3个磁盘。 padr可以这样做吗?
timestamp, diskname, X.Busy
2017-10-07 22:01:00, dm-0,11
2017-10-07 22:01:00, dm-1, 5
2017-10-07 22:01:00, dm-2,20
2017-10-07 22:02:00, dm-0,11
2017-10-07 22:02:00, dm-1,6
2017-10-07 22:02:00, dm-2,20
...Padding occurs here...
2017-10-07 22:05:00, dm-0,12
2017-10-07 22:05:00, dm-1,5
2017-10-07 22:05:00, dm-2,19
非常感谢任何建议。感谢您创建padr,它确实有助于我当前的实现填充缺少时间戳。
Lou Gallo
Louis.G.A.Gallo@gmail.com
答案 0 :(得分:0)
似乎您正在寻找library(dplyr)
library(padr)
#Let's say df has the above sample data
df %>% pad(group = 'diskname') %>% arrange(timestamp, diskname)
{{1}}
希望这有帮助!