我已经尝试了所有StackOverflow解决方案以解决类似问题,但找不到任何东西。
我有这段代码,我需要提取html标签之间的文本,>和<之间的所有内容。
word = "div class="name">
Text_I_Want_To_Extract
</div>"
m = re.search('>(.+)<', word)
print (m)
我尝试了各种正则表达式,但是失败了。我总是得到空结果。我猜是因为我正在提取>和<符号之间的所有内容。
有人在Python 3中遇到过此类问题吗?
答案 0 :(得分:0)
尝试使用flags
例如:
import re
word = """div class="name">
Text_I_Want_To_Extract
</div>"""
m = re.search('>(.+)<', word, flags=re.DOTALL)
print (m.group(1).strip())
输出:
Text_I_Want_To_Extract