Question

我需要提取字符串中的前2个字符，以便稍后创建bin图分布。矢量：

x <- c("75 to 79", "80 to 84", "85 to 89")

我已经走到了这一步：

substrRight <- function(x, n){
  substr(x, nchar(x)-n, nchar(x))
}

调用函数

substrRight(x, 1)

响应

[1] "79" "84" "89"

需要打印最后2个字符而不是第一个字符。

[1] "75" "80" "85"

Answer 1

您可以直接使用substr函数获取每个字符串的前两个字符：

x <- c("75 to 79", "80 to 84", "85 to 89")
substr(x, start = 1, stop = 2)
# [1] "75" "80" "85"

您还可以编写一个简单的函数来执行＆＃34;反向＆＃34;子串，给出了开始＆＃39;并且＆＃39;停止＆＃39;假设索引从字符串末尾开始的值：

revSubstr <- function(x, start, stop) {
  x <- strsplit(x, "")
  sapply(x, 
         function(x) paste(rev(rev(x)[start:stop]), collapse = ""), 
         USE.NAMES = FALSE)
}
revSubstr(x, start = 1, stop = 2)
# [1] "79" "84" "89"

Answer 2

这是一个stringr解决方案：

str_extract(x, "^.{3}")

Answer 3

使用gsub ...

x <- c("75 to 79", "80 to 84", "85 to 89") 

gsub(" .*$", "", x) # Replace the rest of the string after 1st space with  nothing
[1] "75" "80" "85"

Answer 4

类似于@ user5249203，但是提取一个数字/组，而不是删除空格后的所有内容。在这种情况下，值可以是任意数量的连续数字。

x <- c("75 to 79", "80 to 84", "85 to 89")

sub("^(\\d+) to \\d+"$, "\\1", x)
# [1] "75" "80" "85"

如果您想在一次呼叫中提取下限和上限，rematch2简洁地将每个“命名组”放入其自己的标题栏中。

rematch2::re_match(x, "^(?<lower>\\d+) to (?<upper>\\d+)$")
# # A tibble: 3 x 4
#   lower upper .text    .match  
#   <chr> <chr> <chr>    <chr>   
# 1 75    79    75 to 79 75 to 79
# 2 80    84    80 to 84 80 to 84
# 3 85    89    85 to 89 85 to 89

提取字符串中的前2个字符

4 个答案: