查找带有特殊开始子字符串和结束子字符串的子字符串的所有出现

时间:2019-03-04 21:48:17

标签: python python-3.x

我有一个包含许多<a href>dummy text</a>子字符串的字符串。当我从字符串中删除它们时,我想找到这些链接并将它们存储在列表中。我已经尝试过re.findall(),但是却给了我不想要的结果。因此,假设我有这样的字符串;

text = "blahblah <a  href> dummytext </a><a href> dummytext </a> blah <a href> dummytext </a>"

当我像这样调用re.findall()方法时;

link = re.findall(r'<a  href>.+</a>', text)

它开始从第一次出现的<a href>到最后一次出现的</a>来查找子字符串,因此当我打印link时,结果是这个

#['<a  href> dummytext </a><a href> dummytext </a> blah <a href> dummytext </a>']

但这不是我想要的。我希望它返回给我这样的列表;

#['<a  href> dummytext </a>', <a href> dummytext </a>', '<a href> dummytext </a>']

反正有这样做吗?预先感谢。

0 个答案:

没有答案