n = read.csv("Student_data (1).csv")
n = n[,-c(29:38)]
length(n)
nrow(n)
#BE
for (i in 1:length(n))
{
for(j in 1:nrow(n))
{
x=c("B.E","Bachelor of Engineering","BACHELOR OF ENGINEERING","B.E.")
if( n[i][[j]] %in% x)
n[i][[j]] = "BE"
}
}
我想清理一个数据框,该数据框具有相同种类的不同因素,但具有不同的名称和表示方式,例如工程学士学位和B.E.。意思是相同的“ BE”,因此我试图同时使用“ for”循环将所有这些因素转换为资格和专长列中的BE,对于其他人则类似,但这给了我一个错误
.subset2(x,i,确切=精确)中的错误:下标超出范围 另外:警告消息:如果if(n [i] [[j]]%in%x)n [i] [[j]] =“ BE”: 条件的长度> 1,并且仅使用第一个元素 谁能帮我这个忙 总是比这更好和有效的方式受到欢迎! 我还在here
中链接了.csv文件。