我们正在尝试根据Google返回的搜索结果页面的html检索图像的最佳猜测。 我们知道图像的最佳猜测是qb-b类,所以我们尝试使用.select方法选择带有'a'标记的元素。然而,当我们使用jsoup的get方法打印检索到的文档时,该文档不包含任何“最佳猜测”字符串。
我们编写的代码如下。我们如何解决它?
String newUrl = connect1.getHeaderField("Location");
Document doc = Jsoup.connect(newUrl.toString()).get();
Elements bestguess = doc.select("a.qb-b");
System.out.println(bestguess.toString());
答案 0 :(得分:0)
您必须设置User-Agent标头。 Google会将您重定向到主页面。尝试:
String newUrl = connect1.getHeaderField("Location");
Document doc = Jsoup.connect(newUrl.toString()).
userAgent("Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/32.0.1700.76 Safari/537.36").
get();
Elements bestguess = doc.select("a.qb-b");
System.out.println(bestguess.toString());