我有这个HTML代码(长HTML代码的一部分):
<div class="yt-lockup-content">
<h3 class="yt-lockup-ellipsize">
<a class="yt-uix-contextlink yt-uix-sessionlink yt-uix-tile-link result-item-translation-title"dir="ltr"title="Rihanna ft. Calvin Harris - We Found Love LYRICS"data-sessionlink="ved=CAoQvxs%3D&ei=CPLZjMDLwbICFUag3wod7Dm-pw%3D%3D"href="***/watch?v=1KzEu5hWmRY***">Rihanna ft. Calvin Harris - We Found Love LYRICS</a></h3><p class="description " dir="ltr">
<b>bla</b> ft. Calvin Harris -
<b>bla</b>
bla bla
<b>bla bla bla</b>
<b>...</b>
</p><div class="yt-lockup-meta">
<ul class="single-line-lego-list">
<li> <a href="/results?search_type=videos&search_query=rihanna+we+found+love&high_definition=1" class="yt-badge-std">HD
</a>
</h3>
我想谈谈这段文字:href = / watch?v = 1KzEu5hWmRY(粗体文字)。 我知道如何获得全部,但我怎么能抓住这个文本? 谢谢, 或
答案 0 :(得分:0)
以下是一个例子:
String html = // your html here ...
Document doc = Jsoup.parse(html);
Element element = doc.select("h3[class=yt-lockup-ellipsize] > a").first();
String hrefLink = element.attr("href");
但是,如果您要解析网站,则应使用Jsoup.connect("http://link.com").get()
代替Jsoup.parse(html)