使用python查找html中的换行符

时间:2019-01-17 17:11:26

标签: python html line break findall

我正在尝试查找所有换行符(br),而且在html网站的段落(p)中查找换行符。 我有这个代码

breaks = re.findall('br<>\n', html)
print len(breaks)

但是它不起作用。任何帮助

1 个答案:

答案 0 :(得分:0)

我不确定您想要什么,因为您没有显示示例输入和输出。

但是,如果您希望在<br>标签或换行符之后进行拆分,则可以尝试以下操作:

# included many vairations of the '<br>' tag
breaks = re.findall('<br>|<br/>|<br />|\n', html)
print len(breaks)

有帮助吗?