在Python中捕获正则表达式

时间:2012-10-04 21:37:28

标签: python regex capturing-group

我想在Python中使用正则表达式来获取</html>标记之后的所有内容,并将其放在字符串中。所以我试着理解如何在Python中实现它,但我无法使其工作。任何人都可以解释我如何做这个荒谬的简单任务吗?

3 个答案:

答案 0 :(得分:6)

您可以在没有正则表达式的情况下执行此操作:

text[text.find('</html>')+7:]

答案 1 :(得分:2)

m = re.match(".*<\html>(.*)",my_html_text_string)
print m.groups()

甚至更好

print my_html_string.split("</html>")[-1]

答案 2 :(得分:1)

import re

text = 'foo</html>bar'
m = re.search('</html>(.*)', text)
print m.group(1)