使用TagSoup解析时如何保持换行?

时间:2012-03-27 14:08:25

标签: jsoup

我的问题非常简单和简短: 有没有办法保持使用JSoup提取文本的换行符? 当我使用.text()方法时,所有的标签似乎都被忽略了。如果我用“\ n”替换
标签并再次解析.text()输出,这些换行符也会被忽略。 那么,这可行吗?或者我应该实现自己的东西,还是尝试使用其他HTML解析器?

提前致谢!

1 个答案:

答案 0 :(得分:1)

您可以清理html并仅保留<br><p>标记(或仅保留<br>),然后只需将此标记替换为“\ n”