我在尝试计算平均温度10分钟但在24小时内矢量时遇到了麻烦。
我有一个以适当的POSIX格式存储在数据帧中的时间序列。唯一的问题是数据间隔不规则(10 + -3分钟)。
我知道如何在几小时,几天,几个月内对它们进行平均但我需要获得24,72或168小时的平均值。
例如,对于168小时的个人资料,我想在观察期间的每个星期一00:00:00平均,然后在00:10:00,00:20:00等,然后每个星期二,星期三等。< / p>
所以我的数据平均值必须符合常规的24/72/168向量。
对于24小时,矢量将定义如下:
seq(ISOdatetime(2001,2,3,0,0,0), ISOdatetime(2001,2,4,0,0,0), by=(60*5))
导致定期24小时向量source of this solution here
[1] "2001-02-03 00:00:00 PST" "2001-02-03 00:05:00 PST"
[3] "2001-02-03 00:10:00 PST" "2001-02-03 00:15:00 PST"
[5] "2001-02-03 00:20:00 PST" "2001-02-03 00:25:00 PST"
[7] "2001-02-03 00:30:00 PST" "2001-02-03 00:35:00 PST"
[9] "2001-02-03 00:40:00 PST" "2001-02-03 00:45:00 PST"
问题是我的数据的时间戳每天都在变化,如下面的示例所示。在2016-09-01首读(假设在00:00:00)是00:01:00,第二天是00:04:00,第二天00:07:00等等。
我尝试xts
和zoo
没有成功,因为汇总限制是小时,我需要在几分钟内定义 。
我发现的多个答案都是通过连续数据集(example1,example2处理平均时间序列。
不幸的是我无法找到有关我的问题的答案。
样本数据库的结构:
'data.frame': 9490 obs. of 2 variables:
$ Date_Time_Stamp : POSIXct, format: "2016-09-01 00:01:00" "2016-09-01 00:11:00" "2016-09-01 00:22:00" "2016-09-01 00:32:00" ...
$ Signal_Raw_Value: num 778 694 592 523 567 ...
我的数据看起来像这样(头)
Date_Time_Stamp Signal_Raw_Value
1 2016-09-01 00:01:00 777.51
2 2016-09-01 00:11:00 694.38
3 2016-09-01 00:22:00 591.69
4 2016-09-01 00:32:00 523.23
5 2016-09-01 00:42:00 567.24
6 2016-09-01 00:52:00 547.68
尾:
Date_Time_Stamp Signal_Raw_Value
9485 2016-11-06 23:02:00 660.15
9486 2016-11-06 23:12:00 635.70
9487 2016-11-06 23:22:00 498.78
9488 2016-11-06 23:32:00 415.65
9489 2016-11-06 23:42:00 425.43
9490 2016-11-06 23:53:00 440.10
2016-09-01的第一个小时
Date_Time_Stamp Signal_Raw_Value
1 2016-09-01 00:01:00 777.51
2 2016-09-01 00:11:00 694.38
3 2016-09-01 00:22:00 591.69
4 2016-09-01 00:32:00 523.23
5 2016-09-01 00:42:00 567.24
6 2016-09-01 00:52:00 547.68
7 2016-09-01 01:02:00 562.35
第二天的第一个小时(2016-09-02)
143 2016-09-02 00:04:00 557.46
144 2016-09-02 00:14:00 557.46
145 2016-09-02 00:24:00 562.35
146 2016-09-02 00:35:00 552.57
147 2016-09-02 00:45:00 503.67
148 2016-09-02 00:55:00 484.11
149 2016-09-02 01:05:00 454.77
排第三天的第一个小时(2016-09-03)
285 2016-09-03 00:07:00 655.26
286 2016-09-03 00:17:00 537.90
287 2016-09-03 00:27:00 464.55
288 2016-09-03 00:38:00 454.77
289 2016-09-03 00:48:00 425.43
290 2016-09-03 00:58:00 420.54
291 2016-09-03 01:08:00 400.98
第四天:
426 2016-09-04 00:00:00 865.53
427 2016-09-04 00:10:00 723.72
428 2016-09-04 00:20:00 621.03
429 2016-09-04 00:30:00 562.35
430 2016-09-04 00:40:00 493.89
431 2016-09-04 00:51:00 459.66
432 2016-09-04 01:01:00 435.21
在处理信号的原始值后,我需要产生这样的东西: 24 hrs profile和168小时:168 hrs profile。
谢谢!
答案 0 :(得分:1)
由于您仍在努力解决此问题,请尝试以下方法:
#Create sample data
#create a sequence of random times (about 10 minutes apart)
rtime <-as.integer(rnorm(1000, 10, 2))
Date_Time_Stamp<- as.POSIXct("2016-09-01")
Date_Time_Stamp<-Date_Time_Stamp+cumsum(rtime)*60
Signal_Raw_Value <- rnorm(1000, 600, 20)
df<-data.frame(Date_Time_Stamp, Signal_Raw_Value)
#End of sample data creation
#Calclated the number of minutes since midnight
df$minutes<-as.integer(format(df$Date_Time_Stamp, "%H"))*60 + as.integer(format(df$Date_Time_Stamp, "%M"))
#break into 144 intervals per day
df$mybreaks<-cut(df$minutes, breaks = seq(0, 1440, 10), include.lowest = TRUE)
#Using dplyr
library(dplyr)
#find mean of each group
summarise( group_by(df, mybreaks), mean(Signal_Raw_Value))
#find number of elements in each grouping
summarise( group_by(df, mybreaks), n())
你的问题陈述不是很清楚。这是一个解决方案,它将每天分成144个10分钟(1440分钟/天)的段,并将整个数据集中的数据平均为144个区间。