从href jsoup中提取内容

时间:2014-12-05 12:17:20

标签: jquery html

给出以下源页面:



 < a class="card-click-target id-track-click" data-server-cookie="CAIaHgocEhoKFGNvbS5yb3Zpby5hbmdyeWJpcmRzEAEYAw==" data-uitype="500" href="/store/apps/details?id=com.rovio.angrybirds" aria-hidden="true" tabindex="-1"></a>
&#13;
&#13;
&#13;

我一直在寻找一段时间而无法找到答案。我需要在搜索ann app后从Google Play源页面中提取href内容,例如,如果我搜索愤怒的小鸟我想从源页面中提取下一个文本:&#34; / store / apps / details?id = com。 rovio.angrybirds&#34; (我得到这个之后的主要目标是获得应用程序的描述)。 谢谢你的帮助!

2 个答案:

答案 0 :(得分:1)

试试这个:

    Document doc = Jsoup.parseBodyFragment(source);
    Elements links = doc.getElementsByTag("a");

    for (Element element : links) {
        System.out.println(element.attr("href"));
    }

顺便说一下,在开始标记中有一个冗余空格(“&lt; a”),它也可能会导致问题。

答案 1 :(得分:0)

在jQuery中使用.attr('href')来实现这一目标。

下面的工作代码段:

&#13;
&#13;
var href = $('.card-click-target.id-track-click').attr('href');

alert(href);
&#13;
<script src="https://ajax.googleapis.com/ajax/libs/jquery/2.1.1/jquery.min.js"></script>

<a 
   class="card-click-target id-track-click" 
   data-server-cookie="CAIaHgocEhoKFGNvbS5yb3Zpby5hbmdyeWJpcmRzEAEYAw==" 
   data-uitype="500" 
   href="/store/apps/details?id=com.rovio.angrybirds" 
   aria-hidden="true" tabindex="-1"
   >
</a>
&#13;
&#13;
&#13;