使用urllib2抓取谷歌搜索结果时收集了哪些信息

时间:2016-06-26 21:32:28

标签: web-scraping urllib2 google-search

在这里刮新手。 我正在尝试使用urllib2&amp ;;来搜索Google搜索结果像下面的美女汤。

domain_to_filter = 'www.google.com'
opener = urllib2.build_opener()
opener.addheaders = [('User-agent', 'Mozilla/5.0')]
for start in range(start_page, (start_page + pages)):
    url = "http://www.google.com/search?q=%s&start=%s" % (query, str(start * 10))
    page = opener.open(url)
    soup = BeautifulSoup(page,'html.parser')

我的问题是: 如果我这样做,谷歌会得到什么样的信息。

我知道他们会得到我的IP地址。 他们还得到了哪些其他信息?如果我在代理上登录谷歌(Firefox或Chrome),他们可以获得我的谷歌ID吗?或者更糟糕的是,如果我使用Window作为操作系统并登录Window10,他们可以获得Microsoft帐户ID吗?

0 个答案:

没有答案