正则表达式(提取值)

时间:2015-06-09 10:00:46

标签: python regex

我想在某个文本之间提取内容。
例如:
<html><title>lol</title></html> 我想提取<title> </ title>之间的内容,我需要哪个正则表达式?

1 个答案:

答案 0 :(得分:2)

您可以使用比正则表达式更好的工具。 阅读HTMLParser

编辑: 但是如果你想使用正则表达式:

import re

def get_tag_body(tagname, text):
    regexp = r'<%s>(.*?)</%s>' % (tagname, tagname)
    rx_obj = re.search(regexp, text, re.IGNORECASE|re.DOTALL)
    return rx_obj.groups()