我使用Core Reporting API从GA获取一些报告并将其本地保存到数据库。我有一个自2007年以来拥有大量数据的网站,我尝试创建一些返回大量行的查询,例如:
start-date = 2007-01-01
结束日期= 2015-12-31
metrics = ga:pageviews
dimensions = ga:pagePath,ga:date,ga:hour,ga:cityId
sort = -ga:date
samplingLevel = HIGHER_PRECISION
然后脚本使用最大允许限制(max-results = 10000)自动翻页结果。问题是结果的总数是一百万。
当我将结束日期更改为2014-12-31时,结果仍然有一百万行。当我使用维度ga:date时,第一个例子中必须有更多行,对吧?两个结果集中的第一个日期相同(开始日期)。两个结果中最后一行的日期等于结束日期。所以看来,两个结果集都没有被削减/限制/减少(不能用英语表示正确的单词)。
此外,我在the documentation中找不到任何关于一百万限制的内容。
答案 0 :(得分:1)
正如其他人所说,听起来这是一个抽样问题。没有任何100万行限制。这是solution that uses Python and the Google Analytics reporting API将您的大数据范围分成多个较小的日期范围和查询以避免采样。在该示例中,提取了超过100万行数据。
答案 1 :(得分:0)
@乔纳森·奥格登
请参见下面的示例请求:
{“ reportRequests”:[{“ viewId”:“ ga:XXXXXXX”,“ dateRanges”:[{“ startDate”:“ 2020-06-21”,“ endDate”:“ 2020-06-23”} ],“ dimensions”:[{“ name”:“ ga:Hour”},{“ name”:“ ga:ChannelGrouping”},{“ name”:“ ga:SocialNetwork”},{“ name”:“ ga :deviceCategory“},{” name“:” ga:Latitude“},{” name“:” ga:Longitude“},{” name“:” ga:PagePath“},{” name“:” ga:Campaign “},{” name“:” ga:PageDepth“}],” metrics“:[{” expression“:” ga:Sessions“},{” expression“:” ga:sessionDuration“},{” expression“: “ ga:pageviews”},{“ expression”:“ ga:Users”},{“ expression”:“ ga:Bounces”},{“ expression”:“ ga:NewUsers”},{“ expression”:“ ga :OrganicSearches“},{” expression“:” ga:Entrances“},{” expression“:” ga:UniquePageViews“},{” expression“:” ga:Exits“}]}]],” useResourceQuotas“:true}