使用Jsoup的Html解析器

时间:2014-07-24 20:46:02

标签: html jsoup

我想在div标签中提取一个讲信息室,但是我试图通过使用(div.lectureinfo房间)来获得演讲室,但它带来了表中的其他内容。有人能帮我吗?这是源代码。

<tr class="odd">
    <th>9:00</th>
        <td>
            <div class=slot data-hour="9" data-day="0" data-day-of-month="9" data-month-name="June" data-month="6" data-year="2014"><span class=target></span>
                    <div rel=tipsy title="Lecture" class="lecture " data-lecture-pk="21044">
                            <strong>CS-M71</strong>
                            <span>CJW</span>
                            <div class="lectureinfo room">Faraday 205 Robert Recorde</div>
                                <div class="lectureinfo weeks">Weeks: 15-16, 18-25</div>
                    </div>

1 个答案:

答案 0 :(得分:0)

首先,StackOverflow和互联网上存在大量问题,其中描述了如何执行此操作。最好的来源当然仍然是Jsoup文档,尤其是Jsoup cookbook

要选择包含多个类的元素,例如<div class="lectureinfo room">,您必须将类名与.分开,例如

Document doc = Jsoup.parse(html);
Element lectureRoom = doc.select("div.lectureinfo.room").first();
System.out.println(lectureRoom.text());

将输出

Faraday 205 Robert Recorde

请务必仔细查看食谱,以尽可能多地获取Jsoup!