每5个字符拆分一个字符串

时间:2014-10-21 22:39:42

标签: r string split string-split

假设我有一个长字符串:

"XOVEWVJIEWNIGOIWENVOIWEWVWEW"

如何拆分它以获得每5个字符后跟一个空格?

"XOVEW VJIEW NIGOI WENVO IWEWV WEW"

请注意,最后一个更短。

我可以做一个循环,我不断计算并按字符构建一个新的字符串字符,但肯定有更好的东西吗?

5 个答案:

答案 0 :(得分:54)

使用正则表达式:

gsub("(.{5})", "\\1 ", "XOVEWVJIEWNIGOIWENVOIWEWVWEW")
# [1] "XOVEW VJIEW NIGOI WENVO IWEWV WEW"

答案 1 :(得分:13)

使用sapply

> string <- "XOVEWVJIEWNIGOIWENVOIWEWVWEW"
> sapply(seq(from=1, to=nchar(string), by=5), function(i) substr(string, i, i+4))
[1] "XOVEW" "VJIEW" "NIGOI" "WENVO" "IWEWV" "WEW"  

答案 2 :(得分:9)

您可以尝试以下内容:

s <- "XOVEWVJIEWNIGOIWENVOIWEWVWEW" # Original string
l <- seq(from=5, to=nchar(s), by=5) # Calculate the location where to chop

# Add sentinels 0 (beginning of string) and nchar(s) (end of string)
# and take substrings. (Thanks to @flodel for the condense expression)
mapply(substr, list(s), c(0, l) + 1, c(l, nchar(s))) 

输出:

[1] "XOVEW" "VJIEW" "NIGOI" "WENVO" "IWEWV" "WEW"

现在,您可以paste生成的向量(使用collapse=' ')获取带空格的单个字符串。

答案 3 :(得分:7)

否*适用stringi解决方案:

x <- "XOVEWVJIEWNIGOIWENVOIWEWVWEW"
stri_sub(x, seq(1, stri_length(x),by=5), length=5)
[1] "XOVEW" "VJIEW" "NIGOI" "WENVO" "IWEWV" "WEW" 

这提取子字符串就像@Jilber答案一样,但stri_sub函数是矢量化的,我们不需要在这里使用* apply。

答案 4 :(得分:6)

您也可以使用没有循环的子字符串。 substring是向量化的substr

x <- "XOVEWVJIEWNIGOIWENVOIWEWVWEW"
n <- seq(1, nc <- nchar(x), by = 5) 
paste(substring(x, n, c(n[-1]-1, nc)), collapse = " ")
# [1] "XOVEW VJIEW NIGOI WENVO IWEWV WEW"