我需要使用R语言解决以下问题。
让我们说我有一个数据集:
X Y
1 1
2 2
3 3
4 4
我将如何遍历数据集,从下一行的X值中减去当前行的X值,然后转到第二行,等等?
目前我有以下内容:
df <- (df[row(df)-1,1] - df[row(df)+1,1])
我想得到以下信息:
X
-1
-1
-1
N/a
但是好像我要进行两次计算,但是我得到了吗?
X
-1
-1
-1
N/a
-1
-1
-1
N/a
我不知道为什么,任何帮助将不胜感激?
答案 0 :(得分:0)
正如@Sotos指出的那样,您可以使用diff
解决此问题。
但这不起作用的原因是因为row()
返回两列的行号
> row(df)
[,1] [,2]
[1,] 1 1
[2,] 2 2
[3,] 3 3
[4,] 4 4
如果仅选择任一列,则代码有效:
df <- (df[row(df)[,1]-1,1] - df[row(df)[,1]+1,1])
答案 1 :(得分:0)
您可以使用diff()
。您也可以使用矩阵乘法来实现。
示例
set.seed(42)
x <- sample(10, 10, replace=TRUE)
> x
[1] 10 10 3 9 7 6 8 2 7 8
> diff(x)
[1] 0 -7 6 -2 -1 2 -6 5 1
# difference matrix approach
lbd <- matrix(0, nrow=length(x) - 1, ncol=length(x)) # setup lambda
diag(lbd) <- -1
diag(lbd[, -1]) <- 1
> lbd
[,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10]
[1,] -1 1 0 0 0 0 0 0 0 0
[2,] 0 -1 1 0 0 0 0 0 0 0
[3,] 0 0 -1 1 0 0 0 0 0 0
[4,] 0 0 0 -1 1 0 0 0 0 0
[5,] 0 0 0 0 -1 1 0 0 0 0
[6,] 0 0 0 0 0 -1 1 0 0 0
[7,] 0 0 0 0 0 0 -1 1 0 0
[8,] 0 0 0 0 0 0 0 -1 1 0
[9,] 0 0 0 0 0 0 0 0 -1 1
> lbd %*% x # matrix multiplication, same result as in `diff(x)` above
[,1]
[1,] 0
[2,] -7
[3,] 6
[4,] -2
[5,] -1
[6,] 2
[7,] -6
[8,] 5
[9,] 1
使用数据:
x1 <- 1:4
lbd1 <- matrix(0, nrow=length(x1) - 1, ncol=length(x1))
diag(lbd1) <- -1
diag(lbd1[, -1]) <- 1
> lbd1 %*% x1
[,1]
[1,] 1
[2,] 1
[3,] 1
> diff(x1) # same
[1] 1 1 1