什么是正确的CSS选择器来获得我需要的东西?

时间:2013-10-16 12:31:07

标签: java css css-selectors jsoup

我正在使用Java lib(JSoup)从我的程序可以摄取然后处理的网站获取内容。具体来说,我正在寻找的内容位于以下ontw div中:

<div class="ms5">
    <div class="header">
        <!-- ... -->
    </div>
    <div class="body">
        <div class="ontw">
            <!-- What I want is here -->
        </div>
    </div>
</div>

使用JSoup,您使用Document doc = JSoup.connect("http://www.example.com").get()下载页面,然后使用doc.select("Your CSS selector string here.");解析该页面的内容。这真的很简单。

我试过了:

doc.select("ms5 body ontw");

但这不起作用。从上面的HTML判断,我的CSS选择器字符串应该是什么?提前谢谢!

4 个答案:

答案 0 :(得分:4)

使用点选择类,因此您必须选择.md5 .body .ontw

doc.select(".md5 .body .ontw");

答案 1 :(得分:1)

Element masthead = doc.select("div.ontw").first();// div with class=ontw

您可以参考JSoup文档:

http://jsoup.org/cookbook/extracting-data/selector-syntax

答案 2 :(得分:1)

doc.select("div.ontw");

将是我期望的

答案 3 :(得分:0)

.ms5 .body .ontw

是你想要的。这是一个演示:http://try.jsoup.org/~jAMCqcMjLMSA5FYJV7Cn3Aah4AE