如何使用JSOUP从div样式获取文本

时间:2015-10-16 18:34:39

标签: java jsoup

如何使用JSOUP获取文本“xxxx”和它的URL。

<div style="width:45%;float:left;border: dashed 1px #966;margin:0 10px;padding:10px;height:400px;">
    <ul>		
        <li><a href="http://xxx.xxx.com/Title?xxxxx" target="_blank">xxxx</a></li>
        <li><b>years:</b>2015</li>
        <li><b>language:</b>non </li>
        <li><b>color:</b>color</li>
    </ul>
</div>

这是我目前的方法,但我什么都没得到:

Elements mvYearElement = doc.select("div[style*=width:45%;float:left;border: dashed.1px #966;margin:0 10px;padding:10px;height:400px;]");

1 个答案:

答案 0 :(得分:2)

问题可能是样式不需要以特定顺序出现。然而,您的选择器会固定订单并列出许多样式。我会尝试确定风格的一部分,真正区分链接,只使用这部分。由于我不知道HTML的其余部分,我只能猜出那个有区别的部分。这可能吗?

Elements els = doc.select(div[style*=dashed]);

然而,这只是一个疯狂的猜测。但也许这也是div的内容与其他人区别开来?在这种情况下,你可以这样做:

Elements els = doc.select(div[style]:has(ul));

或者别的什么。如果您要分享更多HTML,我可能会更具体。