我正在使用Jsoup从网站中提取链接:
String domain_url = "http://www.example.com";
Document doc;
doc = Jsoup.connect(domain_url)
.userAgent("Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)")
.timeout(5000)
.get();
Elements links = doc.select("a[href]");
for (Element link : links)
{
String link_href = link.attr("href");
System.out.println(link_href);
}
当出现绝对网址时:
http://www.example.com/blog
调用此网址没有问题。 但是如何打开相关链接?
/blog
答案 0 :(得分:1)
尝试使用此链接href:
String link_href = link.absUrl("href");
这将为您提供一个绝对可以使用的网址。