线性插值R

时间:2019-01-11 10:38:54

标签: r dataframe linear-interpolation

我有一个名为df_1的data.frame(12x2),它代表月度值:

      month    df_test
 [1,]    1 -1.4408567
 [2,]    2 -1.0007642
 [3,]    3  2.1454113
 [4,]    4  1.6935537
 [5,]    5  0.1149219
 [6,]    6 -1.3205144
 [7,]    7  1.0277486
 [8,]    8  1.0323482
 [9,]    9 -0.1442319
[10,]   10 -0.2091197
[11,]   11 -0.6803158
[12,]   12  0.5965196

和称为df_2的data.frame(8760x2),其中每一行代表与一天的一小时间隔相关的值。 data.frame包含一年的每小时值:

                   time           df_time
1           2015-01-01 00:00:00 -0.4035650
2           2015-01-01 01:00:00  0.1800579
3           2015-01-01 02:00:00 -0.3770589
4           2015-01-01 03:00:00  0.2573456
5           2015-01-01 04:00:00  1.2000178
6           2015-01-01 05:00:00 -0.4276127
...........................................
                  time                df_time
8755           2015-12-31 18:00:00  1.3540119
8756           2015-12-31 19:00:00  0.4852843
8757           2015-12-31 20:00:00 -0.9194670
8758           2015-12-31 21:00:00 -1.0751814
8759           2015-12-31 22:00:00  1.0097749
8760           2015-12-31 23:00:00 -0.1032468

我想获取每天每一小时的df_1。问题在于,所有月份的天数都不相同。

最后,我们应该获得一个名为df_3(8760x2)的data.frame,该值在df_1的值之间进行插值。

感谢帮助!

1 个答案:

答案 0 :(得分:0)

这里完成了zoo。我假设每月值与特定的日期时间戳记(月中,午夜)相关联-您必须这样做。如果要使用其他日期时间戳,只需更改该值即可。

library(zoo)
library(dplyr)
library(tidyr)

df_3 <- df_1 %>%
   mutate(time = paste(2015, month, "15 00:00:00", sep = "-"),
          time = as.POSIXct(strptime(time, "%Y-%m-%d %H:%M:%S"))) %>%
   full_join(df_2) %>%
   arrange(time) %>%
   mutate(df_test = na.approx(df_test, rule = 2))