如何计算字符串向量中的尾随零。例如,如果我的字符串向量是:
x = c('0000','1200','1301','X230','9900')
答案应该是
> numZeros
[1] 4 2 0 1 2
我不想使用多个ifelse
,因为我认为应该存在更优雅,更快速的解决方案。我尝试使用模数,像这样
y = as.integer(x)
numZeros = (!(y%%10000))+(!(y%%1000))+(!(y%%100))+(!(y%%10))
但这需要两个条件才是真的。
然后使用stringr
包并创建了一个解决方案,但它非常冗长。
library(stringr)
numZeros =
4*str_detect(x,"0000") +
3*str_detect(x,"[1-9 A-Z]000") +
2*str_detect(x,"[1-9 A-Z]{2}00") +
str_detect(x,"[1-9 A-Z]{3}0")
此外,我无法通过查看str_detect
的定义来确定ifelse
是否使用str_detect
。
我发现了同样的问题here但是对于python。如果已经回答了R,请提供链接。
答案 0 :(得分:5)
我找到了一个基础为R
的简单解决方案:
x <- c('0000','1200','1301','X230','9900')
nchar(x) - nchar(sub("0*$", "", x))
# > nchar(x) - nchar(sub("0*$", "", x))
# [1] 4 2 0 1 2
答案 1 :(得分:4)
我们可以使用str_extract
在字符串的末尾($
)提取一个或多个0,并使用nchar
来计算。如果需要,将NA
元素分配给0
library(stringr)
res <- nchar(str_extract(x, "0+$"))
res[is.na(res)] <- 0
res
#[1] 4 2 0 1 2
x = c('0000','1200','1301','X230','9900')
答案 2 :(得分:3)
您可以匹配所有尾随0
,然后计算它们。这是一个基础R解决方案:
> matches <- regmatches(x, gregexpr("0(?=0*$)", x, perl=TRUE))
> sapply(matches, length)
[1] 4 2 0 1 2
在此处,0(?=0*$)
匹配任何0
,只会在字符串末尾(*
)后跟零个或多个($
)零。