为什么相同的Google Search API在R vs浏览器中产生不同的结果

时间:2019-10-04 12:32:41

标签: r google-search-api

在浏览器(Chrome)和R中对完全相同的Google Search API查询进行汇总会返回不同数量的结果。这可能是什么原因?唯一明显的区别是,我从计算机(基于英国)在浏览器中提交查询,而R结果来自基于NL的GCE VM。即使我在查询字符串中指定了搜索国家/地区,这也可能是原因吗?

# Pasted in the browser address bar
https://www.googleapis.com/customsearch/v1?q=%22KALLIGIANNIS%22%20Rethymno&num=10&lr=lang_en&cx=SSS&gl=gr&cr=countryGR&dateRestrict=date:r:20150831:20170831&key=XXX&alt=json

# Get request in R
httr::GET('https://www.googleapis.com/customsearch/v1?q=%22KALLIGIANNIS%22%20Rethymno&num=10&lr=lang_en&cx=SSS&gl=gr&cr=countryGR&dateRestrict=date:r:20150831:20170831&key=XXX&alt=json')

浏览器中的结果显示:

"searchInformation": {
  "searchTime": 0.133114,
  "formattedSearchTime": "0.13",
  "totalResults": "109",
  "formattedTotalResults": "109"

R中的结果

oneresult <- GET('https://www.googleapis.com/customsearch/v1?q=%22KALLIGIANNIS%22%20Rethymno&num=10&lr=lang_en&cx=SSS&gl=gr&cr=countryGR&dateRestrict=date:r:20150831:20170831&key=XXX&alt=json')

content(oneresult)[[5]]

$searchTime
[1] 0.584238

$formattedSearchTime
[1] "0.58"

$totalResults
[1] "59"

$formattedTotalResults
[1] "59"

1 个答案:

答案 0 :(得分:0)

google搜索算法是一个黑匣子。根据地理位置和其他参数,得出的结果不同。

例如,在常规模式下使用浏览器(而不是通过googleapis)而不是隐身模式,也会产生不同的结果。

我的猜测是您的假设正确(差异是由搜索来源位置引起的)。