将一列相似值分组

时间:2018-07-31 13:50:46

标签: r

Data frame

你好, 我对R非常陌生,希望有人可以帮助我开始这个项目!为了清楚起见,我在上面附加了我的数据框的图片

所以,我的数据框有20列和20000行。 我想按“名称”列将数据框分为一个新的或旧的数据框,其中将相似的数字分组在一起,而“模型”列中有多个“ D”,我希望整个组从数据框中删除。数据框中还有其他列,以后我需要使用,但第一步是,我需要删除具有多个D的分组 先感谢您。

1 个答案:

答案 0 :(得分:0)

数据:

data<-cbind.data.frame(
      name=sapply(1:200,FUN=function(x) x=paste0(sample(x=c("D","E","F","H","N"),size=5,replace = T),collapse = "")),
      value=rnorm(200)) 

现在,找出“名称”列中哪些行具有两个以上的d(大写或小写)"[dD]{2,}"

index<-grepl("[dD]{2,}",data$name)

最后,您的数据是子集:

data[!index,]
     name        value
1   DNNFD  0.710399226
2   FDFFN -1.140585633
3   FHDEF  0.319493935
4   HNEFE -1.161941990
5   HFEFE  0.087838201
6   EHDEF  0.983140773