如何使用JSOUP获取文本“xxxx”和它的URL。
<div style="width:45%;float:left;border: dashed 1px #966;margin:0 10px;padding:10px;height:400px;">
<ul>
<li><a href="http://xxx.xxx.com/Title?xxxxx" target="_blank">xxxx</a></li>
<li><b>years:</b>2015</li>
<li><b>language:</b>non </li>
<li><b>color:</b>color</li>
</ul>
</div>
这是我目前的方法,但我什么都没得到:
Elements mvYearElement = doc.select("div[style*=width:45%;float:left;border: dashed.1px #966;margin:0 10px;padding:10px;height:400px;]");
答案 0 :(得分:2)
问题可能是样式不需要以特定顺序出现。然而,您的选择器会固定订单并列出许多样式。我会尝试确定风格的一部分,真正区分链接,只使用这部分。由于我不知道HTML的其余部分,我只能猜出那个有区别的部分。这可能吗?
Elements els = doc.select(div[style*=dashed]);
然而,这只是一个疯狂的猜测。但也许这也是div的内容与其他人区别开来?在这种情况下,你可以这样做:
Elements els = doc.select(div[style]:has(ul));
或者别的什么。如果您要分享更多HTML,我可能会更具体。