我想在某个文本之间提取内容。
例如:
<html><title>lol</title></html>
我想提取<title> </ title>
之间的内容,我需要哪个正则表达式?
答案 0 :(得分:2)
您可以使用比正则表达式更好的工具。 阅读HTMLParser
编辑:
但是如果你想使用正则表达式:
import re
def get_tag_body(tagname, text):
regexp = r'<%s>(.*?)</%s>' % (tagname, tagname)
rx_obj = re.search(regexp, text, re.IGNORECASE|re.DOTALL)
return rx_obj.groups()