拆分一个物体

时间:2013-09-25 00:18:07

标签: r

假设我有以下的rle对象:

r = rle(c(rep("M",28),rep("N",4265),rep("M",16),rep("S",2),rep("N",400),rep("M",10)));

我想将其分解为以下字符串向量:

a = c("28M","4265N","16M2S","400N","10M");

含义我将“N”值和非“N”值及其对应的长度分隔为向量中的单独元素。

请注意,所有非Ns都粘贴在一起,这就是结果为“16M2S”而不是“16M”“2S”分开的原因。

最有效的方法是什么?

2 个答案:

答案 0 :(得分:5)

这很有效,速度应该不错:

l <- r$lengths
v <- r$values
s <- paste0(l, v)
n <- v == "N"
i <- cumsum(c(TRUE, head(n, -1) != tail(n, -1)))

unname(vapply(split(s, i), paste, character(1), collapse = ""))
# [1] "28M"   "4265N" "16M2S" "400N"  "10M"  

答案 1 :(得分:1)

另一种可能性:

r2 <- rle(r$values == "N")

len <- r2$lengths

spl <- rep(seq_along(len), len)

len2 <- split(r$lengths, spl)

val <- split(r$values, spl)

mapply(paste0, len2, val, collapse = "", USE.NAMES = FALSE)
# [1] "28M"   "4265N" "16M2S" "400N"  "10M"