使用jsoup来抓取谷歌广告

时间:2016-06-07 14:20:12

标签: java web-scraping jsoup google-search

几个月前我用jsoup来搜索所有谷歌搜索结果,不包括广告。 现在,这与工作正好相反,我需要从谷歌搜索结果中获取所有广告。 事情是我无法在我的文件中找到它们。

问题肯定是错误的标签......

Elements elements = doc.select("div[class=*What do i need to put here?*]");
                    for (Element link : elements) {
                        position++;

                        Elements tempTitles = link.select("h3[]");
                        Element tempSmtng = link.select("a").first();
                        .............

这是从上一份工作中获取的代码。它过去常说class=g并且工作得很好,但现在看来广告类标签只是起作用。 任何建议我在寻找什么标签?

1 个答案:

答案 0 :(得分:0)

你应该能够很容易地自己解决这个问题。只需使用浏览器和Chrome等开发者工具,并在广告上使用Inspect Element。您应该看到正在实现的CSS类。

有关在此处使用Chrome Inspect Element的详细信息:http://css.maxdesign.com.au/selectutorial/

JSoup使用CSS选择器来查找元素。您可以在此处了解如何使用它们:{{3}}。

通过学习基本概念,您可以更好地了解代码的工作方式,因为网站提供商本身就很脆弱,因为网站提供商可以随时更改输出。

相关问题