R:是否有相当于diff(x)的分割?

时间:2016-02-04 11:50:33

标签: r diff

我正在使用财务数据的数据框,我希望在这些数据框之间获取行之间的差异,以及行之间的“更改”。对于差异,任务很简单,只需:

apply(df, MARGIN=2, FUN=function(x) diff(x))

当我想要改变而不是差异时,我的问题就出现了。也就是说,在数据帧的每一列中,我想迭代地将列的下一个元素除以前一个并减去一个。我快速而肮脏的做法如下:

apply(df, MARGIN=2, FUN=function(x) x[2:length(x)]/x[1:length(x)-1]-1)

但是我想知道是否有一个功能会为我做这个?

编辑:根据要求可重现性小:

数据< -data.frame(C(1,2,4,15),C(2,1,5,8))

data

从我自己的代码片段输出(也是预期的):

output

5 个答案:

答案 0 :(得分:3)

我不知道基本的R函数正是如此,但外部包中有不同的lag / lead函数。例如,您可以像这样使用dplyr

> mutate_each(head(iris[-5]), funs(./lag(.)-1))
#  Sepal.Length Sepal.Width Petal.Length Petal.Width
#1           NA          NA           NA          NA
#2  -0.03921569 -0.14285714   0.00000000           0
#3  -0.04081633  0.06666667  -0.07142857           0
#4  -0.02127660 -0.03125000   0.15384615           0
#5   0.08695652  0.16129032  -0.06666667           0
#6   0.08000000  0.08333333   0.21428571           1

与您自己的功能相比:

> apply(head(iris[-5]), MARGIN=2, FUN=function(x) x[2:length(x)]/x[1:length(x)-1]-1)
#  Sepal.Length Sepal.Width Petal.Length Petal.Width
#2  -0.03921569 -0.14285714   0.00000000           0
#3  -0.04081633  0.06666667  -0.07142857           0
#4  -0.02127660 -0.03125000   0.15384615           0
#5   0.08695652  0.16129032  -0.06666667           0
#6   0.08000000  0.08333333   0.21428571           1

您可以将其放入自定义函数中并使用:

f <- function(., n = 1L, default = NA) ./dplyr::lag(., n = n, default = default) -1
mutate_each(head(iris[-5]), funs(f))

答案 1 :(得分:3)

以下是来自shift

data.table选项
library(data.table)
as.data.table(head(iris))[, lapply(.SD, function(x) 
                  x/shift(x)-1), .SDcols=1:4]
#   Sepal.Length Sepal.Width Petal.Length Petal.Width
#1:           NA          NA           NA          NA
#2:  -0.03921569 -0.14285714   0.00000000           0
#3:  -0.04081633  0.06666667  -0.07142857           0
#4:  -0.02127660 -0.03125000   0.15384615           0
#5:   0.08695652  0.16129032  -0.06666667           0
#6:   0.08000000  0.08333333   0.21428571           1

答案 2 :(得分:2)

以下是一些方法。第一个返回一个数据帧,第二个返回一个矩阵,最后一个返回一个zoo对象。前两个不使用任何包。

[^\.]*

答案 3 :(得分:2)

使用日志转换exp(diff(log(x)))-1)

> apply(data, MARGIN=2, FUN=function(x) exp(diff(log(x)))-1)
     c.1..2..4..15. c.2..1..5..8.
[1,]           1.00          -0.5
[2,]           1.00           4.0
[3,]           2.75           0.6

答案 4 :(得分:0)

最简单的方法:

x <- c(10, 20, 30, 40, 50)
x/lag(x)

# [1] NA 2.000000 1.500000 1.333333 1.250000