R中连续数据的插值

时间:2014-06-19 17:02:06

标签: r dataframe interpolation

我的样本数据如下:

data1 <- read.table(text="1/1/12 1:48 AM  1.24
1/1/12 8:14 AM  0.26
1/1/12 2:01 PM  1.15
1/1/12 8:25 PM  0.15
1/2/12 2:36 AM  1.23
1/2/12 9:13 AM  0.25
1/2/12 2:54 PM  1.09
1/2/12 9:17 PM  0.16
1/3/12 3:28 AM  1.24
1/3/12 10:06 AM 0.21
1/3/12 3:52 PM  1.07
1/3/12 10:05 PM 0.15
1/4/12 4:21 AM  1.27
1/4/12 10:56 AM 0.16
1/4/12 4:49 PM  1.08
1/4/12 10:52 PM 0.12
1/5/12 5:12 AM  1.32
1/5/12 11:43 AM 0.1
1/5/12 5:41 PM  1.12
1/5/12 11:37 PM 0.08
1/6/12 5:58 AM  1.38
1/6/12 12:28 PM 0.03
1/6/12 6:27 PM  1.17
", sep="", header=F)

    > head(data1)
      V1   V2 V3   V4           date
1 1/1/12 1:48 AM 1.24 1/1/12 1:48 AM
2 1/1/12 8:14 AM 0.26 1/1/12 8:14 AM
3 1/1/12 2:01 PM 1.15 1/1/12 2:01 PM
4 1/1/12 8:25 PM 0.15 1/1/12 8:25 PM
5 1/2/12 2:36 AM 1.23 1/2/12 2:36 AM
6 1/2/12 9:13 AM 0.25 1/2/12 9:13 AM

将3列合并为一列以生成数据列

data1$date <- paste(data1$V1, data1$V2, data1$V3)

创建日期序列以进行插值

daterange <- seq(from=as.POSIXct("2012-1-1 00:00"), to = as.POSIXct("2012-1-6 00:00"), length.out =1200)

我想找到上面指定的日期范围的相应V4值。我想做线性插值。

1 个答案:

答案 0 :(得分:2)

正如其他人所说,你可以使用approx(...)在连续点之间进行插值,但如果这是一个好主意,那么它是值得商榷的。

data1$posix <- as.POSIXct(data1$date,format="%m/%d/%y %I:%M %p")
df <- as.data.frame(with(data1,approx(posix,V4,n=1200)))  # colnames are "x", "y"
colnames(df) <- c("date","V4")
df$posix     <- as.POSIXct(df$date,origin="1970-01-01")

library(ggplot2)
ggplot()+
  geom_point(data=data1, aes(x=posix, y=V4), color="red", size=5)+
  geom_point(data=df,    aes(x=posix, y=V4), color="blue", size=1)+
  labs(x="Date")

请注意as.POSIXct(...)调用中的格式字符串。您必须使用%I(而不是%H)指定时间为12小时格式,并且您必须指定字符串包含AM / PM(使用%p)或您的角色时间不会正确转换。 (他们转换,但不会抛出错误 - 所以要小心)。