Question

我正在尝试转换格式为＆＃39; initial.df＆＃39;的数据文件。到＃final.df＆＃39;我的编程和R技能正在经过严格的测试。我继续尝试各种方法但没有成功。

# minimal initial data structure
initial.df = cbind.data.frame(dtime = as.POSIXct(c("12:30", "12:31", "12:32", 
              "13:10","13:11","13:12","20:14","20:15", "20:160"), format="%H:%M"),
              flow=c(120, 100, 90, 110, 100, 95, 115, 100, 95))
initial.df

# minimal final data structure
final.df = cbind.data.frame(initial.df, cycle=c(rep(1, 3), rep(2,3), rep(3,3)))
final.df

作为背景，数据文件是在过滤期间每分钟从膜生物反应器记录的数据，并且存在将每个循环分开的过滤间隙。每个循环运行几个小时。提前感谢您的协助。文斯谢谢，文斯

更新数据集以更好地反映实际数据类型：

 initial.df = cbind.data.frame(dtime = as.POSIXct(c("2015-12-18 23:58",
    "2015-12-18 23:59", "2015-12-19 00:01", "2015-12-19 00:02", "2015-12-19 4:58",
    "2015-12-19 04:59", "2015-12-19 05:00", "2015-12-19 05:01", "2015-12-19 5:02",
    "2015-12-19 07:59", "2015-12-19 08:00", "2015-12-19 08:01", "2015-12-19 8:02"), format="%Y-%m-%d %H:%M"), flow=c(120, 100, 90, 80, 75, 110, 100, 95, 85,  115, 100, 95, 90))
    initial.df

# final data structure
final.df = cbind.data.frame(initial.df, cycle=c(rep(1, 4), rep(2,5), rep(3,4)))
final.df

Answer 1

我们可以cut＆＃39; dtime＆＃39;将breaks指定为＆＃39; 1小时＆＃39;创建分组变量，然后获取相邻元素之间的差异（diff），检查哪个元素大于1，并在开头附加TRUE值后计算累积和（作为{{ 1}}输出长度比“dtime”列的长度小1小时

diff

R如何基于时间分段序列生成增量序列

1 个答案: