我有我的Html数据
<table border='0' cellpadding='3' bgcolor="#CCCCCC" class="hostinfo_title2" width='100%' align="center">
<tr align='center' bgcolor="#ffffff">
<td width='26%' class="hostinfo_title3">Archive Url</td>
</tr>
<tr bgcolor="#ffffff"
<td height="25" align="center">http://www.toradio.com/prgramdetails/20130413_vali_mm.mp3</td>
</tr>
</table>
我想从HTML文本上面获取mp3网址(http://www.toradio.com/prgramdetails/20130413_vali_mm.mp3)。
我正在关注此link,它是正确的还是更好的解析此文本的方法 有人可以帮忙吗?
答案 0 :(得分:1)
结帐JSoup。这是一个很好的HTML Parser for JAVA。
你应该可以用这样的东西做到这一点:
String html = "<YOUR HTML HERE>";
Document doc = Jsoup.parse(html);
Elements tds = doc.select("table.hostinfo_title2").select("td");
String mp3Link = "";
for(Element td : tds) {
if(td.text().contains("mp3") {
mp3Link = td.text();
// do something with mp3Link
}
}