我们正在运行Google Analytics免费版,我看到有关数据采样的一些不一致的结果。我已经在Google Analytics查询资源管理器,GA表格插件以及GA界面中尝试了我的请求。
基本上,我将完整日期范围的结果与分割成较小块的日期范围的结果总和进行比较(以减少/消除采样的可能性)。指标是会话,交易和收入。我应用了会话级动态段:sessions :: condition ::!ga:landingPagePath = @ / thanks
正如您所料,单个请求的结果与计算多个较小请求的结果不同(计数较低)。例如,会议是45,311对51,596,收入进一步分开。这意味着正在将采样用于更大的请求。问题在于API响应明确表示在任何情况下都不使用采样,即“包含采样数据”等于“否”,即使在我们的属性应该超过500,000会话阈值的完整日期范围内进行采样in。
我几乎可以肯定,总结较小日期范围的结果是正确的,因为它们与我们在CMS分析中看到的非常接近。
有谁可以解释这背后的机制? GA是否正在进行某种幕后采样以产生这种不一致性?
谢谢, 丹尼尔
答案 0 :(得分:1)
听起来像是抽样。检查所有来源,看它们是否包含采样,并确保将采样级别设置为“HIGHER_PRECISION”。
1) Google Sheets Google Analytics Add-On 在每个查询的数据单元格B6中检查是否显示“是:for”包含采样数据“
2) Google Analytics Query Explorer 位于您的个人资料名称下方的标题中,检查其是否显示“包含采样数据:是”
您可以将查询分解为具有较小日期范围的较小块,以避免采样。这是关于如何Avoid Google Analytics Sampling using Python
的帖子