我一直在寻找一种API来自动检索另一种算法的Google Insights信息,但却无法找到任何内容。 Google上的第一个结果是提供了一个带有python插件的网站,现在已经过时了。
这样的API是存在的,还是有人写过插件,也许是为了python?
答案 0 :(得分:7)
据我所知,目前还没有可用的API,也没有一种从Google Insights中提取数据的方法的工作实现。但是,我找到了一个解决我(稍微更具体)问题的方法,这个问题可以通过知道搜索某些术语的次数来解决。
这可以通过与用于webbrowser搜索栏的Google Suggest协议进行交互来完成。当你给它一个单词时,它会返回一个建议短语列表以及每个阶段被搜索的次数(我不确定时间单位,大概在去年)。
这是一些用于执行此操作的python代码,稍微改编自odewahn1在O'reilly Answers处的代码,并在Python 2.6及更低版本上工作:
from sgmllib import SGMLParser
import urllib2
import urllib
# Define the class that will parse the suggestion XML
class PullSuggestions(SGMLParser):
def reset(self):
SGMLParser.reset(self)
self.suggestions = []
self.queries = []
def start_suggestion(self, attrs):
for a in attrs:
if a[0] == 'data': self.suggestions.append(a[1])
def start_num_queries(self, attrs):
for a in attrs:
if a[0] == 'int': self.queries.append(a[1])
# ENTER THE BASE QUERY HERE
base_query = "" #This is the base query
base_query += "%s"
alphabet = "abcdefghijklmnopqrstuvwxyz"
for letter in alphabet:
q = base_query % letter;
query = urllib.urlencode({'q' : q})
url = "http://google.com/complete/search?output=toolbar&%s" % query
res = urllib2.urlopen(url)
parser = PullSuggestions()
parser.feed(res.read())
parser.close()
for i in range(0,len(parser.suggestions)):
print "%s\t%s" % (parser.suggestions[i], parser.queries[i])
这至少部分地解决了这个问题,但不幸的是,仍然难以可靠地获得任何特定单词或短语的搜索次数,也无法获得不同短语的搜索历史。
答案 1 :(得分:2)
我刚刚开始搜索它,并找到了一种在以下script中使用python检索它的好方法。基本上它是将专门的引用传递给谷歌历史财务数据库。
def get_index(gindex, startdate=20040101):
"""
API wrapper for Google Domestic Trends data.
https://www.google.com/finance/domestic_trends
Available Indices:
'ADVERT', 'AIRTVL', 'AUTOBY', 'AUTOFI', 'AUTO', 'BIZIND', 'BNKRPT',
'COMLND', 'COMPUT', 'CONSTR', 'CRCARD', 'DURBLE', 'EDUCAT', 'INVEST',
'FINPLN', 'FURNTR', 'INSUR', 'JOBS', 'LUXURY', 'MOBILE', 'MTGE',
'RLEST', 'RENTAL', 'SHOP', 'TRAVEL', 'UNEMPL'
"""
base_url = 'http://www.google.com/finance/historical?q=GOOGLEINDEX_US:'
full_url = '%s%s&output=csv&startdate=%s' % (base_url, gindex, startdate)
dframe = read_csv(urlopen(full_url), index_col=0)
dframe.index = DatetimeIndex(dframe.index)
dframe = dframe.sort_index(0)
for col in dframe.columns:
if len(dframe[col].unique()) == 1:
dframe.pop(col)
if len(dframe.columns) == 1 and dframe.columns[0] == 'Close':
dframe.columns = [gindex]
return dframe[gindex]
答案 2 :(得分:0)
我找不到Google提供的任何文档,但Brad Jasper似乎已经提出了一些查询Insights信息的方法。注意:我不确定它是否仍然有效......祝你好运!
答案 3 :(得分:0)
可悲的是,Google Adwords API Keyword Estimator可能会解决您的需求