在R数据框中减去对角线?

时间:2018-06-14 15:06:05

标签: r dataframe dplyr tidyverse

这是我的数据框:

ID  max_t       min_t       diff
1.9 84904814    84904755    NA  
1.4 84905065    84905014    -310    
1.6 84905290    84905248    -276    
1.0 84906383    84906316    -1135   
2.9 82023344    82023251    2882972 
2.4 82023527    82023419    -276    
2.6 82023669    82023561    -250    
2.0 82023811    82023728    -250    

我的问题在于diff列。

我想要检查范围/ timediff,如下所示:

1.4 min_t - 1.9 max_t (84905014-84904814)
1.6 min_t - 1.4 max_t (84905248-84905065) 

...

预期产出:

   ID    max_t    min_t     diff
1 1.9 84904814 84904755      200
2 1.4 84905065 84905014      183
3 1.6 84905290 84905248     1026
4 1.0 84906383 84906316 -2883132
5 2.9 82023344 82023251       75
6 2.4 82023527 82023419       34
7 2.6 82023669 82023561       59
8 2.0 82023811 82023728       NA

这是我所做的,但它并没有为我提供我想要的东西。 请告诉我这里想念的是什么?

test$diff <- lag(test$min_t, 1) - test$max_t

2 个答案:

答案 0 :(得分:4)

您应该使用lead代替lag

library(dplyr)

test %>%
  mutate(lag_min_t = lag(min_t), # For demo
         lead_min_t = lead(min_t), # For demo
         diff = lead(min_t) - max_t)

<强>结果:

   ID    max_t    min_t     diff lag_min_t lead_min_t
1 1.9 84904814 84904755      200        NA   84905014
2 1.4 84905065 84905014      183  84904755   84905248
3 1.6 84905290 84905248     1026  84905014   84906316
4 1.0 84906383 84906316 -2883132  84905248   82023251
5 2.9 82023344 82023251       75  84906316   82023419
6 2.4 82023527 82023419       34  82023251   82023561
7 2.6 82023669 82023561       59  82023419   82023728
8 2.0 82023811 82023728       NA  82023561         NA

答案 1 :(得分:1)

好。我看到了。我认为你的问题是滞后不能及时向前移动而是向后移动。在您的情况下,滞后(测试$ min_t,1)不是从1.9min_t开始,而是在之前的一个,它不存在。它也导致你的操作向后(差异实际上是1.4max_t - 1.9min_t),这与你想要的相反?

不是使用滞后,而是可以在不同的位置减去向量,并在向量的开头添加NA:

    test$diff <- c(NA,min_t[-1] - max_t[-length(max_t)])