Jsoup总是添加一个标签

时间:2014-12-14 08:44:22

标签: jsoup

我试图用

解析http://www.moneycontrol.com/stocks/marketstats/gainerloser.php?optex=NSE&opttopic=topgainers&index=-2
Document document = Jsoup.parseBodyFragment(html);

Elements tableElements = document.select("table[class=tbldata14 bdrtpg]");

这样我就可以获得<tr> <table class="tbldata14 bdrtpg" width="100%" border="0" cellspacing="0" cellpadding="0"> <tbody>,但它会附加一个额外的<table class="tbldata14 bdrtpg" width="100%" border="0" cellspacing="0" cellpadding="0"> **<tbody>** <tr class="bggry"> <th width="19%" align="left" class="brdrgtgry"><a href="/stocks/marketstats/gainerloser.php?optex=NSE&amp;opttopic=topgainers&amp;sort=sc_comp&amp;order=" class="bl_12"><b>Company Name</b></a></th> <th class="brdrgtgry" align="left">High</th> <th class="brdrgtgry" align="left">Low</th> ..... ,而原始的html中没有这个{。}}。

{{1}}

感谢您的帮助。

1 个答案:

答案 0 :(得分:0)

做这样的事情:

document.select("table[class=tbldata14 bdrtpg] tr");

它将选择表格的实际内容。