如何使用Jsoup提取特定内容?

时间:2013-02-24 01:52:47

标签: android json parsing html-parsing jsoup

如何从此示例HTML代码中提取全名? 我只想得到以下内容。

全名1

全名2

全名3

<div class="readerP">
                                            <p><a href="link1_english.html"  title="Complete" >Full name1</a><br>[ other info ]</br> </p>
                                            </di                                        
<div class="readerP">
                                            <p><a href="link2_english.html"  title="Complete" >Full name2</a><br>[ other info ]</br> </p>
                                            </div>
<div class="readerP">
                                            <p><a href="link1_english.html"  title="Complete" >Full name3</a><br>[ other info ]</br> </p>
                                            </div>

我正在使用此代码,但它会查看页面中的所有“a”标记,因此我会获得额外的信息,例如。

首页

关于

全名1

全名2

全名3

依旧......

  try {
        doc = Jsoup.connect("http://www.somesite.com").get();
         Elements links = doc.getElementsByTag("a");
         for (Element el : links) {
             linkText = el.ownText();

             arr_linkText.add(linkText);
        }
    } catch (IOException e) {
        // TODO Auto-generated catch block
        e.printStackTrace();
    }

如何查看“ div ”标记,如果 class =“readerP”,请查看其中的“ a ”标记'的'?

1 个答案:

答案 0 :(得分:0)

  

如何查看'div'标签,如果class =“readerP”看'a'   'div'里面的标签?

使用适当的选择器,而不只是按标签搜索。

Elements links = doc.select("div .readerP a");

详细了解Jsoup documentation中的选择器。