在R

时间:2016-09-15 14:51:05

标签: r diff

如果我有像mtcars这样的样本数据框,并且我想找到所有行的mtcars $ qsec之间的差异,我可以做diff(mtcars $ qsec)。但有没有一种简单的方法可以使diff(mtcars $ qsec)成为原始mtcars数据框中的新列?我发现它很困难,因为diff(mtcars $ qsec)中的行数少于其他mtcars。

> head(mtcars,3)

               mpg cyl  disp  hp drat    wt  qsec vs am gear carb
Mazda RX4     21.0   6 160.0 110 3.90 2.620 16.46  0  1    4    4
Mazda RX4 Wag 21.0   6 160.0 110 3.90 2.875 17.02  0  1    4    4
Datsun 710    22.8   4 108.0  93 3.85 2.320 18.61  1  1    4    1

2 个答案:

答案 0 :(得分:5)

这是两种方法。两者都将NA放在diff_qsec的第一行,并将diff(qsec)放入其余行:

library(dplyr)  
mtcars %>% mutate(diff_qsec = qsec - lag(qsec)) # dplyr has its own version of lag

transform(mtcars, diff_qsec = c(NA, diff(qsec)))

此外,关于填充的一般问题,请参阅:How can I pad a vector with NA from the front?

答案 1 :(得分:1)

您可以在()中使用基本函数,如下所示:

mtcars <- within(mtcars, difference <- c(NA,diff(qsec)))

这会创建一个名为“difference”的列,其中第一个元素为NA,其余的值由diff(qsec)计算。

您可以通过在{}中包装命令来同时创建更多列,例如:

mtcars <- within(mtcars, {difference <- c(NA,diff(qsec))
                         multiple <- qsec*2})

请注意,您必须使用&lt; - 表示作业,而不是=。