如何在<a> hyperlink tag</a>之间提取文本

时间:2014-12-04 08:35:58

标签: java jsoup

我试图在<a>代码之间获取文字,但它不想工作,但它适用于<strong>代码

代码:

标签无效的示例

public static void init() throws SQLException, InstantiationException, IllegalAccessException, ClassNotFoundException, IOException{

    Document doc = Jsoup.connect("https://www.google.com.au/webhp?sourceid=chrome-instant&ion=1&espv=2&ie=UTF-8#q=example").timeout(20*1000).get();
    Elements taglink=doc.select("#rso > div.srg > li:nth-child(1) > div > h3 > a"); 
    StringBuilder sb = new StringBuilder(taglink.text());
    System.out.println("Text "+sb);
}

1 个答案:

答案 0 :(得分:1)

doc = Jsoup.connect("http://google.com").get();

 Elements links = doc.select("a[href]");
    for (Element link : links) {

        System.out.println("\nlink : " + link.attr("href"));
        System.out.println("text : " + link.text());

}

您可以尝试使用此代码获取超链接之间的所有超链接以及文本。尝试此操作,如果您发现任何其他问题,请告诉我。