我在R中有一个数据集(320万行),它由成对的时间(毫秒)和伏特组成。收集数据的传感器仅在白天运行,因此时间实际上是自当天启动以来的毫秒数。
例如,如果传感器每天运行12小时,那么一天的最大可能时间值为43,400,000毫秒(12h * 60m * 60s * 1000ms
)。
数据不断添加到单个文件中,这意味着有许多重叠的时间值:
X: [1,2,3,4,5,1,2,3,4,5,1,2,3,4,5...] // example if range was 1-5 for one day
Y: [voltage readings at each point in time...]
我想将每个" run"分开。进入独特的数据框架,以便我可以清楚地看到个别日子。目前,当我绘制整个数据集时,它是非常混乱的,因为实际上所有的日子都在单个图中显示。谢谢你的帮助。
答案 0 :(得分:2)
如果您的data.frame df
包含X
列和Y
,则diff
每次X
发现时都可以使用df$Day = cumsum(c(1, diff(df$X) < 0))
Day1 = df[df$Day==1,]
plot(Day1$X, Day1$Y)
查找那天,听起来像):
{{1}}