我想使用Jsoup解析链接。它工作正常,但是当我作为参数链接传递,看起来像“http://translate.google.com”(包含多于1个点)时会生成错误。
public class HtmlProcessor {
public String[] getLinks(String url) throws IOException {
Vector <String> hrefs = new Vector <String> ();
try {
Document doc = Jsoup.connect( url ).get();
Elements links = doc.getElementsByTag("a");
for (Element link : links) {
hrefs.add( link.attr( "href" ) );
}
} catch (ConnectException ex) {
System.out.println(ex.getMessage());
}
return hrefs.toArray( new String [hrefs.size()] );
}
}
答案 0 :(得分:0)
我尝试进入http://translate.google.com并出现用户代理错误。试试这个;它解决了我的问题:
Document doc = Jsoup
.connect( url )
.userAgent("Mozilla/5.0 (Windows NT 6.1; WOW64; rv:17.0) Gecko/17.0 Firefox/17.0")
.get();