我有两个不同频率的不同时间戳数据文件。我想基于(+ _2分钟)范围内的第二数据文件的时间戳(YY:DD:MM HH:MM:00)从一个文件(YY:DD:MM HH:MM:SS)中提取数据。 我需要根据第二个数据的每个时间戳值提取数据。
我怎么解决?我是否需要申请循环或其他任何东西?我在R
中使用xts包和newcomer答案 0 :(得分:0)
您没有提供reproducible example,因此很难解决您的问题,但请尝试调整此代码:
INPUT :来自两个文件的两个data.frame:
df1<-data.frame(ts1=c("18: 24: 03 11: 12: 13","18: 24: 03 11: 20: 13","18: 24: 03 11: 21: 33"),b=c(1,2,3))
df2<-data.frame(ts2=c("18: 24: 03 9: 50: 00","18: 24: 03 11: 20: 00"))
df1
ts1 b
1 18: 24: 03 11: 12: 13 1
2 18: 24: 03 11: 20: 13 2
3 18: 24: 03 11: 21: 33 3
df2
ts2
1 18: 24: 03 9: 50: 00
2 18: 24: 03 11: 20: 00
与间隔日期匹配的函数f
f<-function(ts,ts2)
{
out<-(as.POSIXct(ts,format="%y: %d: %m %H: %M: %S")<=as.POSIXct(ts2,format="%y: %d: %m %H: %M: %S")+2*60) & (as.POSIXct(ts,format="%y: %d: %m %H: %M: %S")>=as.POSIXct(ts2,format="%y: %d: %m %H: %M: %S")-2*60)
return(as.logical(max(out)))
}
您想要的输出:
df1[unlist(lapply(as.POSIXct(df1$ts1,format="%y: %d: %m %H: %M: %S"),f,ts2=df2$ts2)),]
ts1 b
2 18: 24: 03 11: 20: 13 2
3 18: 24: 03 11: 21: 33 3
这显然只是帮助您实现代码的方法
更新,使用不同的时间戳格式:
Input:
df1<-data.frame(a=c(2,5,8,2),ts1=c("2017-10-07 16:51:08.000","2017-10-07 16:51:10.000","2017-10-07 16:52:15.000","2017-10-07 16:53:25.000"))
df2<-data.frame(ts2=c("2017-10-07 16:50:00","2017-10-07 16:51:00","2017-10-07 16:53:00"))
同样的方法:
f<-function(ts,ts2)
{
out<-(as.POSIXct(ts)<=as.POSIXct(ts2)+2*60) & (as.POSIXct(ts)>=as.POSIXct(ts2)-2*60)
return(as.logical(max(out)))
}
你的输出:
df1[unlist(lapply(as.POSIXct(df1$ts1),f,ts2=df2$ts2)),]
a ts1
1 2 2017-10-07 16:51:08.000
2 5 2017-10-07 16:51:10.000
3 8 2017-10-07 16:52:15.000
4 2 2017-10-07 16:53:25.000
答案 1 :(得分:0)
此处w_low =时间2分钟w_high =时间+2分钟最终= data.table()for(i in 1:nrow(Output)){t_low <-Output [i,DateTime]-w_low * 60 t_high <-Output_Data [i,DateTime]-w_high * 60
input_subset <-输入[TIMESTAMP> = t_low&TIMESTAMP input_subset [,TIMESTAMP:= difftime(TIMESTAMP,t_low,units =“ secs”)] input_subset $ output_index <-rep(i,n)final = rbind(OF,input_subset,fill = TRUE)