重新排列R中的数据框

时间:2010-08-28 20:07:17

标签: r dataframe

以下R代码从我正在处理的数据框生成一个片段:

rep1 <- c("20/02/01","23/03/02")
rep2 <- c(NA, "03/05/02")
rep3 <- c("16/04/01",NA)
rep4 <- c(NA,"12/02/03")
data <- data.frame(rep1 = rep1, rep2 = rep2, rep3 = rep3, rep4 = rep4)

代码生成的数据框如下所示:

      rep1     rep2     rep3     rep4
1 20/02/01     <NA> 16/04/01     <NA>
2 23/03/02 03/05/02     <NA> 12/02/03

我想重新排列这个数据框,看起来像这样:

      rep1     rep2   rep3     rep4
1 20/02/01 16/04/01    <NA>     <NA>
2 23/03/02 03/05/02   12/02/03   <NA> 

也就是说,对于每一行,我想用行中的下一个条目替换每个NA,直到该行中只剩下NAs。

真正的数据框由数千行组成,因此手工执行此操作意味着办公室的许多工作时间。

如果有人能告诉我如何在R中这样做,我将非常感激!

2 个答案:

答案 0 :(得分:1)

我不确定我理解,但似乎你想将NA移到最后一列?这是一种方式(快速完成;可能有一种更清洁的方式):

> d <- data.frame(rbind(c(1, 2, NA, 4, NA, 6), c(NA, 2, 3, 4, 5, 6)))
> d
  X1 X2 X3 X4 X5 X6
1  1  2 NA  4 NA  6
2 NA  2  3  4  5  6
> t(apply(d, 1, function(x) c(x[!is.na(x)], rep(NA, sum(is.na(x))))))
     [,1] [,2] [,3] [,4] [,5] [,6]
[1,]    1    2    4    6   NA   NA
[2,]    2    3    4    5    6   NA

关于您的数据:

> t(apply(data, 1, function(x) c(x[!is.na(x)], rep(NA, sum(is.na(x))))))
     [,1]       [,2]       [,3]       [,4]
[1,] "20/02/01" "16/04/01" NA         NA  
[2,] "23/03/02" "03/05/02" "12/02/03" NA  

答案 1 :(得分:0)

按照文斯的建议,但也许有点清洁:

t(apply(d, 1, function(x) x[order(x)]))