Question

我想在某个文本之间提取内容。
例如：
<html><title>lol</title></html> 我想提取<title> </ title>之间的内容，我需要哪个正则表达式？

Answer 1

您可以使用比正则表达式更好的工具。阅读HTMLParser

编辑：但是如果你想使用正则表达式：

import re

def get_tag_body(tagname, text):
    regexp = r'<%s>(.*?)</%s>' % (tagname, tagname)
    rx_obj = re.search(regexp, text, re.IGNORECASE|re.DOTALL)
    return rx_obj.groups()

正则表达式（提取值）

1 个答案: