Jsoup使用.select提取信息

时间:2016-06-25 07:04:26

标签: java html jsoup

我正在尝试使用Jsoups .select从Pandora中提取我喜欢的歌曲。

HTML:     

<div class="user_feed clearfix">
    <div id="profile_tip_spacer">&nbsp;</div>


        <!-- FEED ITEM START 6008047449161974 -->
        <div class="section clearfix"
             webname="genericprofile"
             listenerId="1326689853"
             feedId="6008047449161974"
             feedIndex="1"
                                        >
            <div class="infobox">
                <div class="infobox-thumb">
                    <div class="owner_profile_image">

                            <a href="/profile/genericprofile">
                                <div class="feed_profile pfora-img-square pfora-img-square--50x50" style="background-image:url(/img/no_listener_image.png)"></div>
                            </a>

                                                                                                                </div><!--  owner_profile_image -->
                </div><!-- infobox-thumb -->
                <div class="infobox-body">
                    <div class="like_song feed_details clearfix">
                                                    <h3 class="hed-4">
                            <div class="newsfeed_text clearfix"><span class="user_name"><span class="user_name self"><a href="/profile/genericprofile" fbid="0" webname="genericprofile" class="facebookName">genericprofile</a></span> likes</span> <span class="newsfeed_song_name"><a href="/logic/man-of-year-single/man-of-year">Man Of The Year</a></span> <span>by</span> <span class="newsfeed_song_name"><a href="/logic">Logic</a></span><br />
                                <ul class="list-h-1">

使用此Java代码。

public static void main(String[] args) {
    Document doc = null;
    try {
        doc = Jsoup.connect(
                "http://www.pandora.com/profile/genericprofile")
                .get();
    } catch (IOException e) {
        // TODO Auto-generated catch block
        e.printStackTrace();
    }
    Elements links = doc.select("div.user_feed.clearfix");
    String title = doc.title();
    System.out.println(title);
    for (Element e : links) {
        System.out.println(links);
    }

}

}

我已经能够显示user_feed clearfix类但是无法使用

选择所有section clearfix元素
doc.select("div.user_feed.clearfix > div.section clearfix");

最终我的最终目标是能够获得包含歌曲名称和艺术家的href链接,在本例中是Logic的年度人物,并使用String类进行操作。

1 个答案:

答案 0 :(得分:0)

您应该使用:

div.section.clearfix

选择divsection类的clearfix