你好, 我对R非常陌生,希望有人可以帮助我开始这个项目!为了清楚起见,我在上面附加了我的数据框的图片
所以,我的数据框有20列和20000行。 我想按“名称”列将数据框分为一个新的或旧的数据框,其中将相似的数字分组在一起,而“模型”列中有多个“ D”,我希望整个组从数据框中删除。数据框中还有其他列,以后我需要使用,但第一步是,我需要删除具有多个D的分组 先感谢您。
答案 0 :(得分:0)
数据:
data<-cbind.data.frame(
name=sapply(1:200,FUN=function(x) x=paste0(sample(x=c("D","E","F","H","N"),size=5,replace = T),collapse = "")),
value=rnorm(200))
现在,找出“名称”列中哪些行具有两个以上的d(大写或小写)"[dD]{2,}"
index<-grepl("[dD]{2,}",data$name)
最后,您的数据是子集:
data[!index,]
name value
1 DNNFD 0.710399226
2 FDFFN -1.140585633
3 FHDEF 0.319493935
4 HNEFE -1.161941990
5 HFEFE 0.087838201
6 EHDEF 0.983140773