计算R

时间:2018-02-28 07:56:26

标签: r regex string stringr

如何计算字符串向量中的尾随零。例如,如果我的字符串向量是:

x = c('0000','1200','1301','X230','9900')

答案应该是

> numZeros
[1] 4 2 0 1 2

我不想使用多个ifelse,因为我认为应该存在更优雅,更快速的解决方案。我尝试使用模数,像这样

y = as.integer(x)
numZeros = (!(y%%10000))+(!(y%%1000))+(!(y%%100))+(!(y%%10))

但这需要两个条件才是真的。

  • 字符串的最大长度是固定的(在我的情况下也是如此)和
  • 向量中的所有字符串都可以转换为整数,在我的情况下不是这样。

然后使用stringr包并创建了一个解决方案,但它非常冗长。

library(stringr)
numZeros = 
4*str_detect(x,"0000") + 
3*str_detect(x,"[1-9 A-Z]000") + 
2*str_detect(x,"[1-9 A-Z]{2}00") + 
str_detect(x,"[1-9 A-Z]{3}0")

此外,我无法通过查看str_detect的定义来确定ifelse是否使用str_detect

我发现了同样的问题here但是对于python。如果已经回答了R,请提供链接。

3 个答案:

答案 0 :(得分:5)

我找到了一个基础为R的简单解决方案:

x <- c('0000','1200','1301','X230','9900')
nchar(x) - nchar(sub("0*$", "", x))
# > nchar(x) - nchar(sub("0*$", "", x))
# [1] 4 2 0 1 2

答案 1 :(得分:4)

我们可以使用str_extract在字符串的末尾($)提取一个或多个0,并使用nchar来计算。如果需要,将NA元素分配给0

library(stringr)
res <- nchar(str_extract(x, "0+$"))
res[is.na(res)] <- 0
res
#[1] 4 2 0 1 2

数据

x = c('0000','1200','1301','X230','9900')

答案 2 :(得分:3)

您可以匹配所有尾随0,然后计算它们。这是一个基础R解决方案:

> matches <- regmatches(x, gregexpr("0(?=0*$)", x, perl=TRUE))
> sapply(matches, length)
[1] 4 2 0 1 2

在此处,0(?=0*$)匹配任何0,只会在字符串末尾(*)后跟零个或多个($)零。

请参阅this regex demoR demo online