Question

我有以下data.frame：

A <- c(10,
       12,
       14.4,
       17.28,
       20.736)
B <- c(6,
       7.8,
       10.14,
       13.182,
       17.1366)

df <- data.frame(A, B)
df

看起来像这样：

       A       B
1 10.000  6.0000
2 12.000  7.8000
3 14.400 10.1400
4 17.280 13.1820
5 20.736 17.1366

现在，我想提供确切的表格，但要考虑增长因素：

因此，“滞后”应位于一个位置：下一个值应除以先例值。有功能吗？

Answer 1

基本R：

df2 <- as.data.frame(lapply(df, function(a) c(1, a[-1] / a[-length(a)])))
df2
#     A   B
# 1 1.0 1.0
# 2 1.2 1.3
# 3 1.2 1.3
# 4 1.2 1.3
# 5 1.2 1.3

我推断第一个应该是“ 1.0”，因为第一个没有增长。一个人也可以轻易地认为第一个应该是NA。交给你。

Answer 2

如果该值在下一次迭代中不应该更新

library(dplyr)
df %>%
   mutate_all(~ ./lag(., default = first(.)))
#   A   B
#1 1.0 1.0
#2 1.2 1.3
#3 1.2 1.3
#4 1.2 1.3
#5 1.2 1.3

如果需要更新值，我们可以使用accumulate中的purrr

df %>% 
     mutate(A =  purrr::accumulate(A, ~ .x/.y))

或用于多列

df %>%
        mutate_all(~ purrr::accumulate(., `/`))

R中的滞后数据帧

2 个答案: