我有一个包含许多<a href>dummy text</a>
子字符串的字符串。当我从字符串中删除它们时,我想找到这些链接并将它们存储在列表中。我已经尝试过re.findall()
,但是却给了我不想要的结果。因此,假设我有这样的字符串;
text = "blahblah <a href> dummytext </a><a href> dummytext </a> blah <a href> dummytext </a>"
当我像这样调用re.findall()
方法时;
link = re.findall(r'<a href>.+</a>', text)
它开始从第一次出现的<a href>
到最后一次出现的</a>
来查找子字符串,因此当我打印link
时,结果是这个
#['<a href> dummytext </a><a href> dummytext </a> blah <a href> dummytext </a>']
但这不是我想要的。我希望它返回给我这样的列表;
#['<a href> dummytext </a>', <a href> dummytext </a>', '<a href> dummytext </a>']
反正有这样做吗?预先感谢。