如何单独对大写文本进行分组

时间:2017-08-28 06:04:51

标签: r

如果同时存在大写和小写文本,那么如何仅在其中仅对大写文本进行子集化。

例如: 考虑有这样的文字“Cumi Speed CUMIACC04 Mar 04”

我只需要“CUMIACC04”作为输出

其次考虑我有一组链接,例如:

http://www.industrybuying.com/abrasive-cloth-rolls-norton-AB.CO.AB6.388773/

我需要获得链接的最后一部分 - “AB.CO.AB6.388773 /”单独如何在R编程中进行子集化并执行此操作。

** strsplit是我尝试的选项之一,但是链接的长度  是变化所以我无法得到正确的结果,所以如何解决这个问题  在R编程。**

1 个答案:

答案 0 :(得分:2)

我们可以使用str_extract

library(stringr)
str_extract(str1, "\\b[A-Z.]+[0-9.]*\\b")
#[1] "CUMIACC04"        "AB.CO.AB6.388773"

数据

str1 <- c("Cumi Speed CUMIACC04 Mar 04", "Cumi Speed AB.CO.AB6.388773/ Mar 05")