删除数据帧列表中的重复列r

时间:2016-01-21 20:11:08

标签: r list dataframe duplicates

我有一个包含许多数据帧的列表。每个数据框都包含重复的列。我想只返回每个数据帧中的唯一列。我尝试了几个代码,包括下面的代码,但仍然会出错。我目前使用的代码如下,并列出了我的列表中第一个数据帧的描述。我感谢任何帮助。

x  <- lapply(dataFiles, function(x){
  for(i in 1:length(colnames(dataFiles)))
  dataFiles[[!duplicated(dataFiles[[i]])]]
}
)



str(dataFiles[[1]])
'data.frame':   20381 obs. of  10 variables:
 $ FILEID    : chr  "ACSSF" "ACSSF" "ACSSF" "ACSSF" ...
 $ FILETYPE  : num  2.01e+08 2.01e+08 2.01e+08 2.01e+08 2.01e+08 ...
 $ STUSAB    : chr  "ny" "ny" "ny" "ny" ...
 $ CHARITER  : int  0 0 0 0 0 0 0 0 0 0 ...
 $ SEQUENCE  : int  1 1 1 1 1 1 1 1 1 1 ...
 $ LOGRECNO  : int  3391 3392 3393 3394 3395 3396 3397 3398 3399 3400 ...
 $ B00001_001: int  212 215 278 246 235 NA 225 522 213 262 ...
 $ B00002_001: int  108 124 126 105 122 NA 108 105 104 140 ...
 $ LOGRECNO  : int  3391 3392 3393 3394 3395 3396 3397 3398 3399 3400 ...
 $ GEOID     : chr  "14000US36001000100" "14000US36001000200" "14000US36001000300" "14000US36001000401" ...

1 个答案:

答案 0 :(得分:5)

这是一个简单的例子:

tmp <- data.frame(seq(10), seq(10), rnorm(10))
colnames(tmp) <- c("A","A","B")

l <- list(tmp, tmp)

lapply(l, function(x) x[,!duplicated(colnames(x))])

或@agstudy指出,您可以使用unique

lapply(l, function(x) x[,unique(colnames(x))])