字符串提取/匹配在“_”之间,但该值可以没有空格/空格/或是数字并且具有特殊字符(即&)

时间:2018-04-18 21:52:40

标签: r

我有一组字符串,可能的例子有:AS-04_PS粉丝(兴趣)科幻游戏Interest_IND,AS-08_5-694640-113017& CRM_INDAS-08_5-694640-113017_IND。

我想提取下划线之间的序列。

我使用了代码: str_match(x,"_(\\w+?)_IND")[,2]

如果我摆脱空格和括号,我注意到这段代码效果更好。任何方式让我在不弄乱数据的情况下正确提取?

1 个答案:

答案 0 :(得分:0)

你在找这个吗?

x <- "AS-04_PS Fans (Interest) Sci-Fi Games Interest_IND, AS-08_5-694640-113017 & CRM_INDAS-08_5-694640-113017_IND"
str_split(x, "_IND")

# [[1]]
# [1] "AS-04_PS Fans (Interest) Sci-Fi Games Interest" ", AS-08_5-694640-113017 & CRM"                  "AS-08_5-694640-113017"                         
# [4] ""