我有一组字符串,可能的例子有:AS-04_PS粉丝(兴趣)科幻游戏Interest_IND,AS-08_5-694640-113017& CRM_INDAS-08_5-694640-113017_IND。
我想提取下划线之间的序列。
我使用了代码:
str_match(x,"_(\\w+?)_IND")[,2]
如果我摆脱空格和括号,我注意到这段代码效果更好。任何方式让我在不弄乱数据的情况下正确提取?
答案 0 :(得分:0)
你在找这个吗?
x <- "AS-04_PS Fans (Interest) Sci-Fi Games Interest_IND, AS-08_5-694640-113017 & CRM_INDAS-08_5-694640-113017_IND"
str_split(x, "_IND")
# [[1]]
# [1] "AS-04_PS Fans (Interest) Sci-Fi Games Interest" ", AS-08_5-694640-113017 & CRM" "AS-08_5-694640-113017"
# [4] ""