索引没有循环的neigboring值

时间:2016-12-01 11:23:27

标签: r loops

我喜欢从data.frame中平均值小于其邻居的值。这是一个例子:

 df <- data.frame(V1 = c(1:10), V2 = c(0.5, 1, 2, 6, 7, 6.5, 8, 8.2, 8.1, 8.5))

 for (i in 2:(nrow(df)-1)) {
    df[i,2] <- ifelse( 
      df[i,2] < df[i+1,2] & df[i,2] < df[i-1,2], 
      mean(c(df[i+1,2], df[i-1,2])), 
      df[i,2]
    )
 }

有没有更好的方法来省略for循环?

2 个答案:

答案 0 :(得分:0)

我们可以尝试

 i1 <- c(FALSE, (df$V2[-nrow(df)] - df$V2[-1])>0 & (df$V2[-1] - df$V2[-nrow(df)]) < 0)

df$V2[i1] <- sapply(which(i1), function(i) mean(df$V2[c(i-1,i+1)]))
df$V2
#[1] 0.50 1.00 2.00 6.00 7.00 7.50 8.00 8.20 8.35 8.50

或者

i2 <- which(i1)
df$V2[i2] <- (df$V2[i2-1] + df$V2[i2+1])/2

或使用na.approx

library(zoo)
df$V2 <- na.approx(df$V2*NA^(i1))

答案 1 :(得分:0)

你可以做这个矢量化:

inds <- which(with(df, V2<c(NA,head(V2,-1)) & V2<c(tail(V2,-1),NA)))
#[1] 6 9

df$V2[inds] <- (df$V2[inds-1]+df$V2[inds+1])/2

   # V1   V2
# 1   1 0.50
# 2   2 1.00
# 3   3 2.00
# 4   4 6.00
# 5   5 7.00
# 6   6 7.50
# 7   7 8.00
# 8   8 8.20
# 9   9 8.35
# 10 10 8.50