Python 3正则表达式提取字符串的一部分

时间:2018-08-02 12:49:37

标签: python regex python-3.x

我已经尝试了所有StackOverflow解决方案以解决类似问题,但找不到任何东西。

我有这段代码,我需要提取html标签之间的文本,>和<之间的所有内容。

word = "div class="name">
                        Text_I_Want_To_Extract 
                    </div>"

m = re.search('>(.+)<', word)
print (m)

我尝试了各种正则表达式,但是失败了。我总是得到空结果。我猜是因为我正在提取>和<符号之间的所有内容。

有人在Python 3中遇到过此类问题吗?

1 个答案:

答案 0 :(得分:0)

尝试使用flags

例如:

import re

word = """div class="name">
                        Text_I_Want_To_Extract 
                    </div>"""

m = re.search('>(.+)<', word, flags=re.DOTALL)
print (m.group(1).strip())

输出:

Text_I_Want_To_Extract