Html Dom与jsoup

时间:2012-09-19 13:14:34

标签: dom jsoup

我有这个HTML代码(长HTML代码的一部分):

<div class="yt-lockup-content">
<h3 class="yt-lockup-ellipsize">
    <a class="yt-uix-contextlink yt-uix-sessionlink yt-uix-tile-link result-item-translation-title"dir="ltr"title="Rihanna ft. Calvin Harris - We Found Love LYRICS"data-sessionlink="ved=CAoQvxs%3D&amp;ei=CPLZjMDLwbICFUag3wod7Dm-pw%3D%3D"href="***/watch?v=1KzEu5hWmRY***">Rihanna ft. Calvin Harris - We Found Love LYRICS</a></h3><p class="description " dir="ltr">
        <b>bla</b> ft. Calvin Harris - 
        <b>bla</b> 
        bla bla
        <b>bla bla bla</b> 
        <b>...</b>
        </p><div class="yt-lockup-meta">    
        <ul class="single-line-lego-list">
      <li>    <a href="/results?search_type=videos&amp;search_query=rihanna+we+found+love&amp;high_definition=1" class="yt-badge-std">HD
      </a> 
</h3>   

我想谈谈这段文字:href = / watch?v = 1KzEu5hWmRY(粗体文字)。 我知道如何获得全部,但我怎么能抓住这个文本? 谢谢, 或

1 个答案:

答案 0 :(得分:0)

以下是一个例子:

String html = // your html here ...

Document doc = Jsoup.parse(html);

Element element = doc.select("h3[class=yt-lockup-ellipsize] > a").first();
String hrefLink = element.attr("href");

但是,如果您要解析网站,则应使用Jsoup.connect("http://link.com").get()代替Jsoup.parse(html)