Google Analytics(分析) - 采样数据提供的会话数多于API查询

时间:2016-05-22 08:26:28

标签: google-analytics google-analytics-api

我正致力于使用Core Reporting API V3自动化Google Analytics报告。

当我请求包含我之前定义的段的查询的数据时,会发生以下情况

使用API​​获取的查询报告的会话,用户和网页浏览等指标高于Google Analytics报告中显示的指标。 我注意到在GA提交的报告中,他们提到了它们的样本。 这引起了怀疑,因为我认为抽样效应的指标低于整个计算指标。

这有什么用呢? (非抽样报告中的度量标准的级别高于抽样报告中的度量标准)

1 个答案:

答案 0 :(得分:2)

抽样只是意味着数据不准确:它同样可能大于或小于真实值。

举例来说,假设我在一家拥有10,000名员工的公司工作。大奶酪想要对他们的员工进行非常详细的调查,以确保每个人都满意,但认为失去10,000小时的工作时间是不行的。相反,他们随机选择了1,000名员工。只要选择是真正随机的,那应该是一个代表性的样本,这意味着该群体的性别平衡,种族,与孩子的百分比,平均通勤时间等将与整个劳动力大致相同。

同样,如果您要求Google Analytics运行需要大量汇总的报告,则可能会决定只查看一半的数据。即使是最简单的请求也经常需要大量的计算;从他们的角度来看,在这段时间内随机选择40%或50%的会话要便宜得多,并将结果扩大。

他们之后将结果相乘以进行补偿,因此您看到的结果将近似等于真实值。最大的变化将出现在经常不会发生的事情上;假设你有一个“花费1000英镑的人”的活动,那可能每年发生一次。如果这个随机出现在谷歌的样本中,它可能会决定它每年发生两次。否则,它可能会认为它永远不会发生。

如果您面临大量采样,有几种方法可以避免它。我推荐以下内容:

  • 避免使用用户指标;这是计算时间最耗时的事情之一。
  • 保持您的时间短。
  • 避免使用复杂的细分。
  • 尽量不要一次使用太多尺寸。
  • 尽量不要打这么多!你有大量多余的活动吗?您是否在多个网站上使用相同的代码?过度使用虚拟页面视图?

如果您拥有Google Analytics Premium,则可以请求非抽样报告,但应注意为“用户”指标提供的导出总计;他们仍然搞砸了。

无论如何都可以进行抽样;在极端情况下,他们可能会将你减少到不到1%的会话。你应该用一小撮盐取任何抽样的统计数据,但也要明白他们知道他们在做什么。如果您的样本量是50%或更多,那么你很好。任何不到40%,你应该开始担心。如果你的收入低于1%,那么谷歌分析的确会超出其突破点,所以如果它没有尽力帮助你,不要感到惊讶。