如何使用Jsoup保留新行?

时间:2014-01-16 09:38:27

标签: jsoup lines preserve

有没有办法用Jsoup保存新行(不是< BR>)?

Document pdsc = Jsoup.connect("http://drafts.bestsiteeditor.com/promoters/dsc1387266263.txt").get();
String strText = pdsc.body().ownText();

tv.setText(strText);

TXT文件内容来自textarea提交表单,其中包含新行。 感谢。

1 个答案:

答案 0 :(得分:0)

在文档上我不认为有一种方法可以返回保留新行的文本。如果您确定要打印的文本节点,则有一个方法:getWholeText(http://jsoup.org/apidocs/org/jsoup/nodes/TextNode.html#getWholeText())。如果你想要整个html,你必须提取所有文本节点(文档的递归遍历)。对于您的示例(它只有一个文本节点):

  Document pdsc = Jsoup.connect("http://drafts.bestsiteeditor.com/promoters/dsc1387266263.txt").get();
  System.out.println(((TextNode) pdsc.select("body").first().childNode(0)).getWholeText());

更通用的解决方案:

private static void prinWholeText(Document doc) {
    List<TextNode> textNode = getAllTextNodes(doc);
    for(TextNode tn:textNode){
        System.out.println(tn.getWholeText());
    }
}

private static List<TextNode> getAllTextNodes(Document doc) {
    List<TextNode> nodes = new ArrayList<>();
    allTextNodes(doc, nodes);
    return nodes;
}

private static void allTextNodes(Element element,  List<TextNode> nodes) {
    for(Node child: element.childNodes()){
        if(child instanceof TextNode){
            nodes.add((TextNode) child);
        } else{
            if(child instanceof Element){
                allTextNodes((Element) child, nodes);
            }
            //implement others
        }
    }
}