如何用java中的值读取html标记

时间:2014-03-05 12:06:25

标签: java jsoup

我想要像这样的输出

tag=value

喜欢这个(body=hello)

String html="<html><body><div class=\"main\">" + "<div class=\"sub\"> sub </div>" + "main </div></body></html>";

Document doc=Jsoup.parse(html);
Elements divs=doc.select("div");
for(Element div : divs){
System.out.println(div.ownText());
}

1 个答案:

答案 0 :(得分:0)

我想您要做的是显示每个标记名称及其中的内容。示例代码是这样的。

    String html="<html><body><div class=\"main\">" + "<div class=\"sub\"> sub </div>" + "main </div></body></html>";
    Document doc=Jsoup.parse(html);
    Elements divs=doc.select("*");
    for(Element div : divs){
        System.out.println(div.tag() + ":\n" + div.toString());
        System.out.println("---");
    }

结果显示了这一点。

    #root:
    <html>
     <head></head>
     <body>
      <div class="main">
       <div class="sub">
         sub 
       </div>main 
      </div>
     </body>
    </html>
    ---
    html:
    <html>
     <head></head>
     <body>
      <div class="main">
       <div class="sub">
         sub 
       </div>main 
      </div>
     </body>
    </html>
    ---
    head:
    <head></head>
    ---
    body:
    <body>
     <div class="main">
      <div class="sub">
        sub 
      </div>main 
     </div>
    </body>
    ---
    div:
    <div class="main">
     <div class="sub">
       sub 
     </div>main 
    </div>
    ---
    div:
    <div class="sub">
      sub 
    </div>
    ---