我有一个包含一堆列的数据集,其中列值(该列的所有值)与该列名完全相同。如何删除该列。我不能一个一个地删除列,因为有700多个变量。 谢谢!
答案 0 :(得分:3)
以下是您可以执行此操作的示例:
.loc
基本上代码所做的是,如果列data = data.frame(x1 = rep(1,10), x2 = seq(1,20,by = 2),
x3 = rep("x3",10), x4 = 1:10, x5 = rep("x5",10))
col_rm = which(sapply(1:ncol(data), function(x) all(data[,x] == colnames(data)[x])))
data = data[,-col_rm]
的所有值都等于列的名称并查找满足该条件的所有列,然后我只是用{{1删除它们}}
答案 1 :(得分:1)
这有帮助吗?
data = data.frame(name1=rep("name1",5), name2=rep("name2",5), name3=rep("name3",5), name4=rep("name4",5)) #Some test data
ColsToRemove <- names(data)[which(sapply(data[1,], function(x){x %in% names(data)}))] #Finds where the column name is the same as the first entry and marks it for deletion
cleanData = data[ , !(names(data) %in% ColsToRemove)] #This deletes the columns named
head(data)
head(cleanData)
答案 2 :(得分:0)
您可以使用sweep
来确定所有与字母名称不相等的值
data[colSums(sweep(data,2,colnames(data),"!="))>0]