这是我的数据框:
ID max_t min_t diff
1.9 84904814 84904755 NA
1.4 84905065 84905014 -310
1.6 84905290 84905248 -276
1.0 84906383 84906316 -1135
2.9 82023344 82023251 2882972
2.4 82023527 82023419 -276
2.6 82023669 82023561 -250
2.0 82023811 82023728 -250
我的问题在于diff列。
我想要检查范围/ timediff,如下所示:
1.4 min_t - 1.9 max_t (84905014-84904814)
1.6 min_t - 1.4 max_t (84905248-84905065)
...
预期产出:
ID max_t min_t diff
1 1.9 84904814 84904755 200
2 1.4 84905065 84905014 183
3 1.6 84905290 84905248 1026
4 1.0 84906383 84906316 -2883132
5 2.9 82023344 82023251 75
6 2.4 82023527 82023419 34
7 2.6 82023669 82023561 59
8 2.0 82023811 82023728 NA
这是我所做的,但它并没有为我提供我想要的东西。 请告诉我这里想念的是什么?
test$diff <- lag(test$min_t, 1) - test$max_t
答案 0 :(得分:4)
您应该使用lead
代替lag
:
library(dplyr)
test %>%
mutate(lag_min_t = lag(min_t), # For demo
lead_min_t = lead(min_t), # For demo
diff = lead(min_t) - max_t)
<强>结果:强>
ID max_t min_t diff lag_min_t lead_min_t
1 1.9 84904814 84904755 200 NA 84905014
2 1.4 84905065 84905014 183 84904755 84905248
3 1.6 84905290 84905248 1026 84905014 84906316
4 1.0 84906383 84906316 -2883132 84905248 82023251
5 2.9 82023344 82023251 75 84906316 82023419
6 2.4 82023527 82023419 34 82023251 82023561
7 2.6 82023669 82023561 59 82023419 82023728
8 2.0 82023811 82023728 NA 82023561 NA
答案 1 :(得分:1)
好。我看到了。我认为你的问题是滞后不能及时向前移动而是向后移动。在您的情况下,滞后(测试$ min_t,1)不是从1.9min_t开始,而是在之前的一个,它不存在。它也导致你的操作向后(差异实际上是1.4max_t - 1.9min_t),这与你想要的相反?
不是使用滞后,而是可以在不同的位置减去向量,并在向量的开头添加NA:
test$diff <- c(NA,min_t[-1] - max_t[-length(max_t)])