为了做一些相对简单的事情,我正在抓取文本,到目前为止我没有遇到任何问题,但我需要保留<br>
标签,因为空白分析是数据集的重要组成部分
是否可以保留<br>
代码,以便稍后将其转换为\n\r
。
示例:
<p>
<span>Some text.</br></span>
<a>Some more text.<br></a>
<span>Some more more text.<br></span>
</p>
我需要:Some text.<br>Some more text.<br>Some more more text.<br>
现在我得到:Some text. Some more text. Some more more text.
么?
答案 0 :(得分:4)
唯一的方法是获取所选内容的html格式,您只需将列类型从Text更改为HTML,也无法只获取文本+ <br>
。< / p>