我正在使用Java lib(JSoup)从我的程序可以摄取然后处理的网站获取内容。具体来说,我正在寻找的内容位于以下ontw
div中:
<div class="ms5">
<div class="header">
<!-- ... -->
</div>
<div class="body">
<div class="ontw">
<!-- What I want is here -->
</div>
</div>
</div>
使用JSoup,您使用Document doc = JSoup.connect("http://www.example.com").get()
下载页面,然后使用doc.select("Your CSS selector string here.");
解析该页面的内容。这真的很简单。
我试过了:
doc.select("ms5 body ontw");
但这不起作用。从上面的HTML判断,我的CSS选择器字符串应该是什么?提前谢谢!
答案 0 :(得分:4)
使用点选择类,因此您必须选择.md5 .body .ontw
doc.select(".md5 .body .ontw");
答案 1 :(得分:1)
Element masthead = doc.select("div.ontw").first();// div with class=ontw
您可以参考JSoup文档:
答案 2 :(得分:1)
doc.select("div.ontw");
将是我期望的
答案 3 :(得分:0)
.ms5 .body .ontw
是你想要的。这是一个演示:http://try.jsoup.org/~jAMCqcMjLMSA5FYJV7Cn3Aah4AE