我有一个包含许多数据帧的列表。每个数据框都包含重复的列。我想只返回每个数据帧中的唯一列。我尝试了几个代码,包括下面的代码,但仍然会出错。我目前使用的代码如下,并列出了我的列表中第一个数据帧的描述。我感谢任何帮助。
x <- lapply(dataFiles, function(x){
for(i in 1:length(colnames(dataFiles)))
dataFiles[[!duplicated(dataFiles[[i]])]]
}
)
str(dataFiles[[1]])
'data.frame': 20381 obs. of 10 variables:
$ FILEID : chr "ACSSF" "ACSSF" "ACSSF" "ACSSF" ...
$ FILETYPE : num 2.01e+08 2.01e+08 2.01e+08 2.01e+08 2.01e+08 ...
$ STUSAB : chr "ny" "ny" "ny" "ny" ...
$ CHARITER : int 0 0 0 0 0 0 0 0 0 0 ...
$ SEQUENCE : int 1 1 1 1 1 1 1 1 1 1 ...
$ LOGRECNO : int 3391 3392 3393 3394 3395 3396 3397 3398 3399 3400 ...
$ B00001_001: int 212 215 278 246 235 NA 225 522 213 262 ...
$ B00002_001: int 108 124 126 105 122 NA 108 105 104 140 ...
$ LOGRECNO : int 3391 3392 3393 3394 3395 3396 3397 3398 3399 3400 ...
$ GEOID : chr "14000US36001000100" "14000US36001000200" "14000US36001000300" "14000US36001000401" ...
答案 0 :(得分:5)
这是一个简单的例子:
tmp <- data.frame(seq(10), seq(10), rnorm(10))
colnames(tmp) <- c("A","A","B")
l <- list(tmp, tmp)
lapply(l, function(x) x[,!duplicated(colnames(x))])
或@agstudy指出,您可以使用unique
lapply(l, function(x) x[,unique(colnames(x))])