我尝试使用正则表达式进行分组并且我在检索某些信息时遇到了问题。我想要实现的是,具有以下文字:
<ed><a0><bd><ed><b2><9c><ed><a0><bd><ed><b2><9c><ed><a0><bd><ed><b4><91><ed><a0><bd><ed><b4><91>
我想要一个选择字符组的正则表达式,并考虑到赔率<ed>
例如,选择的第一个组为<ed><a0><bd><ed><b2><9c>
,选择的第二个组为<ed><a0><bd><ed><b2><9c>
我可以通过哪种方式实现这一目标?
答案 0 :(得分:2)
假设您使用Regex的Python实现,这将起作用:
re.findall('<ed>.*?<ed>.*?(?=<ed>)', string)
答案 1 :(得分:0)
终于找到了做到这一点的方法。要清楚的是从R中通过twitteR API获得的twitter文本中提取表情符号的方法,所以代码将是
str_extract_all(i, pattern='<U\\+....>|<ed>.*?<ed>.*?>.*?>')