Question

你好，我对R非常陌生，希望有人可以帮助我开始这个项目！为了清楚起见，我在上面附加了我的数据框的图片

所以，我的数据框有20列和20000行。我想按“名称”列将数据框分为一个新的或旧的数据框，其中将相似的数字分组在一起，而“模型”列中有多个“ D”，我希望整个组从数据框中删除。数据框中还有其他列，以后我需要使用，但第一步是，我需要删除具有多个D的分组先感谢您。

Answer 1

数据：

data<-cbind.data.frame(
      name=sapply(1:200,FUN=function(x) x=paste0(sample(x=c("D","E","F","H","N"),size=5,replace = T),collapse = "")),
      value=rnorm(200))

现在，找出“名称”列中哪些行具有两个以上的d（大写或小写）"[dD]{2,}"

index<-grepl("[dD]{2,}",data$name)

最后，您的数据是子集：

data[!index,]
     name        value
1   DNNFD  0.710399226
2   FDFFN -1.140585633
3   FHDEF  0.319493935
4   HNEFE -1.161941990
5   HFEFE  0.087838201
6   EHDEF  0.983140773

将一列相似值分组

1 个答案: