使用R中的grepl()匹配和连接字符

时间:2013-03-26 16:30:26

标签: r character concatenation match

我想使用grepl()函数来确定字符向量是否与模式匹配,并基于该模式连接向量中的字符。例如:

vec <- c("a","b","a","c","a","c","a","b") 
grepl("[a]", vec)
TRUE FALSE  TRUE FALSE  TRUE FALSE  TRUE FALSE

我希望将TRUE之后的所有值绑定在一起,直到下一个为TRUE,这样结果将是一个看起来像的矢量:

"ab", "ac", "ac", "ab"

感谢您的任何想法。

2 个答案:

答案 0 :(得分:5)

如果你没有结婚grepl()

VEC <- paste(vec, collapse="")                # Collapse into single string ...
strsplit(VEC, "(?<=.)(?=a)", perl=TRUE)[[1]]  # ... then split it before each 'a'
# [1] "ab" "ac" "ac" "ab"

答案 1 :(得分:3)

使用此:

groups <- cumsum(grepl("[a]", vec))
# > groups
# [1] 1 1 2 2 3 3 4 4
aggregate(vec, by=list(groups=groups), FUN=function(x)paste(x,collapse=""))

#   groups  x
# 1      1 ab
# 2      2 ac
# 3      3 ac
# 4      4 ab