给出以下源页面:
< a class="card-click-target id-track-click" data-server-cookie="CAIaHgocEhoKFGNvbS5yb3Zpby5hbmdyeWJpcmRzEAEYAw==" data-uitype="500" href="/store/apps/details?id=com.rovio.angrybirds" aria-hidden="true" tabindex="-1"></a>
&#13;
我一直在寻找一段时间而无法找到答案。我需要在搜索ann app后从Google Play源页面中提取href内容,例如,如果我搜索愤怒的小鸟我想从源页面中提取下一个文本:&#34; / store / apps / details?id = com。 rovio.angrybirds&#34; (我得到这个之后的主要目标是获得应用程序的描述)。 谢谢你的帮助!
答案 0 :(得分:1)
试试这个:
Document doc = Jsoup.parseBodyFragment(source);
Elements links = doc.getElementsByTag("a");
for (Element element : links) {
System.out.println(element.attr("href"));
}
顺便说一下,在开始标记中有一个冗余空格(“&lt; a”),它也可能会导致问题。
答案 1 :(得分:0)
在jQuery中使用.attr('href')
来实现这一目标。
下面的工作代码段:
var href = $('.card-click-target.id-track-click').attr('href');
alert(href);
&#13;
<script src="https://ajax.googleapis.com/ajax/libs/jquery/2.1.1/jquery.min.js"></script>
<a
class="card-click-target id-track-click"
data-server-cookie="CAIaHgocEhoKFGNvbS5yb3Zpby5hbmdyeWJpcmRzEAEYAw=="
data-uitype="500"
href="/store/apps/details?id=com.rovio.angrybirds"
aria-hidden="true" tabindex="-1"
>
</a>
&#13;