我正在使用财务数据的数据框,我希望在这些数据框之间获取行之间的差异,以及行之间的“更改”。对于差异,任务很简单,只需:
apply(df, MARGIN=2, FUN=function(x) diff(x))
当我想要改变而不是差异时,我的问题就出现了。也就是说,在数据帧的每一列中,我想迭代地将列的下一个元素除以前一个并减去一个。我快速而肮脏的做法如下:
apply(df, MARGIN=2, FUN=function(x) x[2:length(x)]/x[1:length(x)-1]-1)
但是我想知道是否有一个功能会为我做这个?
编辑:根据要求可重现性小:
数据< -data.frame(C(1,2,4,15),C(2,1,5,8))
从我自己的代码片段输出(也是预期的):
答案 0 :(得分:3)
我不知道基本的R函数正是如此,但外部包中有不同的lag
/ lead
函数。例如,您可以像这样使用dplyr
:
> mutate_each(head(iris[-5]), funs(./lag(.)-1))
# Sepal.Length Sepal.Width Petal.Length Petal.Width
#1 NA NA NA NA
#2 -0.03921569 -0.14285714 0.00000000 0
#3 -0.04081633 0.06666667 -0.07142857 0
#4 -0.02127660 -0.03125000 0.15384615 0
#5 0.08695652 0.16129032 -0.06666667 0
#6 0.08000000 0.08333333 0.21428571 1
与您自己的功能相比:
> apply(head(iris[-5]), MARGIN=2, FUN=function(x) x[2:length(x)]/x[1:length(x)-1]-1)
# Sepal.Length Sepal.Width Petal.Length Petal.Width
#2 -0.03921569 -0.14285714 0.00000000 0
#3 -0.04081633 0.06666667 -0.07142857 0
#4 -0.02127660 -0.03125000 0.15384615 0
#5 0.08695652 0.16129032 -0.06666667 0
#6 0.08000000 0.08333333 0.21428571 1
您可以将其放入自定义函数中并使用:
f <- function(., n = 1L, default = NA) ./dplyr::lag(., n = n, default = default) -1
mutate_each(head(iris[-5]), funs(f))
答案 1 :(得分:3)
以下是来自shift
data.table
选项
library(data.table)
as.data.table(head(iris))[, lapply(.SD, function(x)
x/shift(x)-1), .SDcols=1:4]
# Sepal.Length Sepal.Width Petal.Length Petal.Width
#1: NA NA NA NA
#2: -0.03921569 -0.14285714 0.00000000 0
#3: -0.04081633 0.06666667 -0.07142857 0
#4: -0.02127660 -0.03125000 0.15384615 0
#5: 0.08695652 0.16129032 -0.06666667 0
#6: 0.08000000 0.08333333 0.21428571 1
答案 2 :(得分:2)
以下是一些方法。第一个返回一个数据帧,第二个返回一个矩阵,最后一个返回一个zoo对象。前两个不使用任何包。
[^\.]*
答案 3 :(得分:2)
使用日志转换exp(diff(log(x)))-1)
:
> apply(data, MARGIN=2, FUN=function(x) exp(diff(log(x)))-1)
c.1..2..4..15. c.2..1..5..8.
[1,] 1.00 -0.5
[2,] 1.00 4.0
[3,] 2.75 0.6
答案 4 :(得分:0)
最简单的方法:
x <- c(10, 20, 30, 40, 50)
x/lag(x)
# [1] NA 2.000000 1.500000 1.333333 1.250000