Question

我已经尝试了所有StackOverflow解决方案以解决类似问题，但找不到任何东西。

我有这段代码，我需要提取html标签之间的文本，>和<之间的所有内容。

word = "div class="name">
                        Text_I_Want_To_Extract 
                    </div>"

m = re.search('>(.+)<', word)
print (m)

我尝试了各种正则表达式，但是失败了。我总是得到空结果。我猜是因为我正在提取>和<符号之间的所有内容。

有人在Python 3中遇到过此类问题吗？

Answer 1

尝试使用flags

例如：

import re

word = """div class="name">
                        Text_I_Want_To_Extract 
                    </div>"""

m = re.search('>(.+)<', word, flags=re.DOTALL)
print (m.group(1).strip())

输出：

Text_I_Want_To_Extract

Python 3正则表达式提取字符串的一部分

1 个答案: