如何从html google jsoup中检索图像的最佳猜测

时间:2013-12-21 13:50:10

标签: java html jsoup google-image-search

我们正在尝试根据Google返回的搜索结果页面的html检索图像的最佳猜测。 我们知道图像的最佳猜测是qb-b类,所以我们尝试使用.select方法选择带有'a'标记的元素。然而,当我们使用jsoup的get方法打印检索到的文档时,该文档不包含任何“最佳猜测”字符串。

我们编写的代码如下。我们如何解决它?

String newUrl = connect1.getHeaderField("Location");

Document doc = Jsoup.connect(newUrl.toString()).get();            
Elements bestguess = doc.select("a.qb-b");

System.out.println(bestguess.toString());

1 个答案:

答案 0 :(得分:0)

您必须设置User-Agent标头。 Google会将您重定向到主页面。尝试:

String newUrl = connect1.getHeaderField("Location");

Document doc = Jsoup.connect(newUrl.toString()).
                             userAgent("Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/32.0.1700.76 Safari/537.36").
                             get();            
Elements bestguess = doc.select("a.qb-b");

System.out.println(bestguess.toString());