Question

我尝试使用三种不同的方法提取某个目录的（唯一）访问者计数： *有个人资料 *使用动态高级细分 *使用自定义报告过滤器

在较小的网站上，这三种方法会产生相同的结果。但是在大型网站上（每月访问量超过5M），我的配置文件和高级网段以及另一方面的过滤器之间存在很大差异。这可能是因为采样 - 但在浏览量方面差异较小。使用抽样数据时，访客的估计是否更差，差异是否更大？此外，当从API（使用过滤器或配置文件）提取数据时，即使GA未指示数据已被采样，我仍然会获得不同的数据 - 即我正在查看非抽样数据。

另一个奇怪的事情是，配置文件中的网页浏览量高于过滤器，而过滤器与配置文件的访问者数量较高。我还在配置文件中应用了一个过滤器来强制它使用样本数据 - 我再次得到与过滤器和段数据非常相似的结果。

           profile  filter  segment  filter@profile
unique     25550    37778   36433    37971 
pageviews  202761   184130  n/a      202761

我想要实现的目标是找到一种方法，在我用完个人资料时，可以获得有关独特访问者的准确数据。

可以在此google文档中找到更多有差异的数据：https://docs.google.com/spreadsheet/ccc?key=0Aqzq0UJQNY0XdG1DRFpaeWJveWhhdXZRemRlZ3pFb0E

Answer 1

谷歌分析（免费版）每月只跟踪10百万页面交互[0]（网页浏览量和事件，以“轨道”开头的任何跟踪器方法是交互）[1]，因此可能是您较大网站的数据已经大量采样（我想你们每个人中有500万人有两次以上的互动）[2]。临时报告最多只使用1 mio数据点，因此您可以获得样本样本。当然，聚合值越大，样本量越小。

而且我非常确定数据限制也适用于api访问（Google表示“无法保证将会处理多余的匹配”），因此对于大型网站，api会返回采样（或不完整）数据也是 - 所以你不能真正看到非抽样数据。

至于差异，我会说不同的临时报告使用不同的样本，所以你最终会得到不同的结果。使用GA，你不应该过多地依赖绝对数字，而是要看更多的一般趋势。

[1] Analytics Premium每月跟踪50百万次互动（并得到谷歌的支持），但每年的收入为15万美元

[2] Google建议在大型网站上使用“_setSampleRate（）”，以确保您在每月的每一天实际采样数据，而不是在超出数据限制后随机命中或遗漏。

数据限制：

http://support.google.com/analytics/bin/answer.py?hl=en&answer=1070983）。

setSampleRate：

https://developers.google.com/analytics/devguides/collection/gajs/methods/gaJSApiBasicConfiguration#_gat.GA_Tracker_._setSampleRate

Answer 2

是的，采样数据不太准确，尤其是访客数量。

我也看到他们在两天内错过了500k的综合浏览量，但几天之后才看到他们出现在他们的报道中。看到不同界面的不同结果也不足为奇。即使他们试图变得更加实时，Google Analytics的质量也会下降。看起来他们的代码库在API中是不一致的，他们的算法遍布地图。

我通常坚持使用相同的指标和报告方法，以便我的结果保持相互比较。我还与Gaug.es一起运行GA，作为验证和健全性检查。有了这些额外的数据，我选择了GA最有信心的报告方法，我完全依赖它。

“访客”数量差异很大

2 个答案: