我试图解析这个HTML 如何用jsoup解析它? 我希望得到<之间的所有内容。 TD&GT * LT; / TD>标签:
<table border="0" align="center">
<tr>
<td><h1><a rel='bookmark' href="http://google.com">google</a></h1></td>
<td><font face=tahoma size=2>2014</td></font>
</tr>
<tr>
..
</tr>
<tr>
..
</tr>
</table>
URL url= new URL("http://mylink.html");
Document doc = Jsoup.connect(url.toString()).userAgent("Mozila").get();
.....
答案 0 :(得分:1)
我使用td
doc.select("td");
String html = "<table border=\"0\" align=\"center\">"
+"<tr>"
+"<td><h1><a rel='bookmark' href=\"http://google.com\">google</a></h1></td>"
+"<td><font face=tahoma size=2>2014</td></font>";
Document doc = Jsoup.parse(html);
Elements element=doc.select("td");
for(Element ele:element){
log.d("el","ele.text()");//text() to print in between the text //text() to print in between the text
}