Question

我有这个HTML代码（长HTML代码的一部分）：

<div class="yt-lockup-content">
<h3 class="yt-lockup-ellipsize">
    <a class="yt-uix-contextlink yt-uix-sessionlink yt-uix-tile-link result-item-translation-title"dir="ltr"title="Rihanna ft. Calvin Harris - We Found Love LYRICS"data-sessionlink="ved=CAoQvxs%3D&amp;ei=CPLZjMDLwbICFUag3wod7Dm-pw%3D%3D"href="***/watch?v=1KzEu5hWmRY***">Rihanna ft. Calvin Harris - We Found Love LYRICS</a></h3><p class="description " dir="ltr">
        <b>bla</b> ft. Calvin Harris - 
        <b>bla</b> 
        bla bla
        <b>bla bla bla</b> 
        <b>...</b>
        </p><div class="yt-lockup-meta">    
        <ul class="single-line-lego-list">
      <li>    <a href="/results?search_type=videos&amp;search_query=rihanna+we+found+love&amp;high_definition=1" class="yt-badge-std">HD
      </a> 
</h3>

我想谈谈这段文字：href = / watch？v = 1KzEu5hWmRY（粗体文字）。我知道如何获得全部，但我怎么能抓住这个文本？谢谢，或

Answer 1

以下是一个例子：

String html = // your html here ...

Document doc = Jsoup.parse(html);

Element element = doc.select("h3[class=yt-lockup-ellipsize] > a").first();
String hrefLink = element.attr("href");

但是，如果您要解析网站，则应使用Jsoup.connect("http://link.com").get()代替Jsoup.parse(html)

Html Dom与jsoup

1 个答案: