打开相对路径的URL

时间:2014-11-08 22:29:07

标签: java url web-crawler jsoup

我正在使用Jsoup从网站中提取链接:

String domain_url = "http://www.example.com";
Document doc;

doc = Jsoup.connect(domain_url)
    .userAgent("Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)")
    .timeout(5000)
    .get();

Elements links = doc.select("a[href]");
for (Element link : links)
{
    String link_href = link.attr("href");
    System.out.println(link_href);
}

当出现绝对网址时:

http://www.example.com/blog

调用此网址没有问题。 但是如何打开相关链接?

/blog

1 个答案:

答案 0 :(得分:1)

尝试使用此链接href:

String link_href = link.absUrl("href");

这将为您提供一个绝对可以使用的网址。