如果我有像mtcars这样的样本数据框,并且我想找到所有行的mtcars $ qsec之间的差异,我可以做diff(mtcars $ qsec)。但有没有一种简单的方法可以使diff(mtcars $ qsec)成为原始mtcars数据框中的新列?我发现它很困难,因为diff(mtcars $ qsec)中的行数少于其他mtcars。
> head(mtcars,3)
mpg cyl disp hp drat wt qsec vs am gear carb
Mazda RX4 21.0 6 160.0 110 3.90 2.620 16.46 0 1 4 4
Mazda RX4 Wag 21.0 6 160.0 110 3.90 2.875 17.02 0 1 4 4
Datsun 710 22.8 4 108.0 93 3.85 2.320 18.61 1 1 4 1
答案 0 :(得分:5)
这是两种方法。两者都将NA
放在diff_qsec
的第一行,并将diff(qsec)
放入其余行:
library(dplyr)
mtcars %>% mutate(diff_qsec = qsec - lag(qsec)) # dplyr has its own version of lag
transform(mtcars, diff_qsec = c(NA, diff(qsec)))
此外,关于填充的一般问题,请参阅:How can I pad a vector with NA from the front?
答案 1 :(得分:1)
您可以在()中使用基本函数,如下所示:
mtcars <- within(mtcars, difference <- c(NA,diff(qsec)))
这会创建一个名为“difference”的列,其中第一个元素为NA,其余的值由diff(qsec)计算。
您可以通过在{}中包装命令来同时创建更多列,例如:
mtcars <- within(mtcars, {difference <- c(NA,diff(qsec))
multiple <- qsec*2})
请注意,您必须使用&lt; - 表示作业,而不是=。