用表解析的jsoup标签

时间:2014-01-14 22:21:19

标签: java html-parsing jsoup

如何分隔该表中的每个字母? A和B不能在一起。

Document  doc = Jsoup.connect(getURL).timeout(0).get(); 
Elements getdata= doc.select("tr[bgcolor] td");
for (Element element : getdata) {
         System.out.println(element.text());   
         // it gives A and B together.
        }

<tr bgcolor="#F0F0F0">
  <td>A
    <br> B
  </td>
  <td>C
    <br> D
  </td>
 </tr>

1 个答案:

答案 0 :(得分:0)

来自你的评论:

  

是否可以将<br>标记的文字分开?

是的,通过Node#childNodes,它将为您提供文本节点,然后是br元素,然后是另一个文本节点。

或者如果您愿意,可以通过element.html().split("<br>")完成,但最好使用childNodes