用条件替换dataframe中的行

时间:2015-06-27 23:21:51

标签: r dataframe rstudio

嗨,关于这里的问题: [Dynamically replace row in dataframe with vector

我有一个data.frame例如:

d <- read.table(text='   V1 V2  V3  V4  V5  V6  V7
1 1 a 2 3 4 9 6
2 1 b 2 2 4 5 NA
3 1 c 1 3 4 5 8
4 1 d 1 2 3 6 9
5 2 a 1 2 3 4 5
6 2 b 1 4 5 6 7
7 2 c 1 2 3 5 8
8 2 d 2 3 6 7 9', header=TRUE)

现在我想取一行,例如第一行(1a)和:

从该行获取最小值和最大值。在这种情况下,min = 2和max = 9(注意两者之间缺少值,例如该行中没有5,7或8)。

现在我想用所有缺失值替换该行并扩展它(该行将比其他所有行长,因为它将从2到9(2,3,4,5,6,7,8,9)然后,整个data.frame应该被NA列自动扩展为其他行,而不是我替换的行。

现在,以下代码确实实现了这一目标:

row.to.change <- 1
(new.row <- seq(min(d[row.to.change,c(-1, -2)], na.rm=TRUE), max(d[row.to.change,c(-1,-2)], na.rm=TRUE)))
(num.add <- length(new.row) - ncol(d) + 2)
# [1] 3
if (num.add > 0) {
  d <- cbind(d, replicate(num.add, rep(NA, nrow(d))))
} else if (num.add <= 0) {
  new.row <- c(new.row, rep(NA, -num.add))
}

最后将扩展的data.frame标头重命名为默认标头:

d[row.to.change,c(-1, -2)] <- new.row
colnames(d) <- paste0("V", seq_len(ncol(d)))

现在:这适用于我指定的行:row.to.replace但是如何工作,例如我希望它适用于第二列中包含'b'的所有行?类似的事情:“这样做d $ V2 =='b'”?如果data.frame长5000行。

1 个答案:

答案 0 :(得分:0)

你已经解决了。只需创建一个函数,然后将其应用于数据的每一行。

rtc=function(row.to.change){# <- 1
(new.row <- seq(min(d[row.to.change,c(-1, -2)], na.rm=TRUE), max(d[row.to.change,c(-1,-2)], na.rm=TRUE)))
(num.add <- length(new.row) - ncol(d) + 2)
# [1] 3
if (num.add <= 0) {
  new.row <- c(new.row, rep(NA, -num.add))
}
new.row
}

#d2=d

newr=lapply(1:nrow(d),rtc) # for the hole data
# for specific condition, like lines with "b" in V2 change to:
# newr=lapply(1:nrow(d),function(z)if(d$V2[z]=="b")rtc(z) else as.numeric(d[z,c(-1, -2)])) 
mxl=max(sapply(newr,length))
newr=lapply(newr,function(z)if(length(z)<mxl)c(z,rep(NA,mxl-length(z))) else z)
if (ncol(d)-2 < mxl) {
  d <- cbind(d, replicate(mxl-ncol(d)+2, rep(NA, nrow(d))))
}
d[,c(-1, -2)] <- do.call(rbind,newr)
colnames(d) <- paste0("V", seq_len(ncol(d)))

d

  V1 V2 V3 V4 V5 V6 V7 V8 V9 V10 V11
1  1  a  2  3  4  5  6  7  8   9  NA
2  1  b  2  3  4  5 NA NA NA  NA  NA
3  1  c  1  2  3  4  5  6  7   8  NA
4  1  d  1  2  3  4  5  6  7   8   9
5  2  a  1  2  3  4  5 NA NA  NA  NA
6  2  b  1  2  3  4  5  6  7  NA  NA
7  2  c  1  2  3  4  5  6  7   8  NA
8  2  d  2  3  4  5  6  7  8   9  NA