我有
形式的庞大数据集 V1 V2 V3 V4 V5 V6
1 201005010000 201005010000 1.68 291.38 1 0
2 201005010000 201005010300 0.93 335.10 1 0
3 201005010000 201005010600 2.25 57.38 1 0
4 201005010000 201005010900 0.43 13.76 1 0
5 201005010000 201005011200 0.74 101.14 1 0
我有兴趣在一小时内插入它(这是3个小时)。接下来的八天每六小时后数据也会更新。 提前谢谢。
答案 0 :(得分:1)
我认为你要求在V2矢量之间以等间隔的间隔插入变量V3和V4,该矢量以300的增量变化。这说明对于V3这样做,但添加类似计算的interp-V4将是微不足道的。 (我还没弄清楚我们应该对有关更新的信息做些什么。)
> a100 <- approxfun( y=dat$V3, x=dat$V2)
> intvec <- a100(seq(dat$V2[1], dat$V2[length(dat$V2)], by=100)
+ )
> intvec
[1] 1.6800000 1.4300000 1.1800000 0.9300000 1.3700000 1.8100000 2.2500000
[8] 1.6433333 1.0366667 0.4300000 0.5333333 0.6366667 0.7400000
> data.frame(V2 = seq(dat$V2[1], dat$V2[length(dat$V2)], by=100),
+ V3 =intvec)
V2 V3
1 201005010000 1.6800000
2 201005010100 1.4300000
3 201005010200 1.1800000
4 201005010300 0.9300000
5 201005010400 1.3700000
6 201005010500 1.8100000
7 201005010600 2.2500000
8 201005010700 1.6433333
9 201005010800 1.0366667
10 201005010900 0.4300000
11 201005011000 0.5333333
12 201005011100 0.6366667
13 201005011200 0.7400000