我尝试使用三种不同的方法提取某个目录的(唯一)访问者计数: *有个人资料 *使用动态高级细分 *使用自定义报告过滤器
在较小的网站上,这三种方法会产生相同的结果。但是在大型网站上(每月访问量超过5M),我的配置文件和高级网段以及另一方面的过滤器之间存在很大差异。这可能是因为采样 - 但在浏览量方面差异较小。使用抽样数据时,访客的估计是否更差,差异是否更大?此外,当从API(使用过滤器或配置文件)提取数据时,即使GA未指示数据已被采样,我仍然会获得不同的数据 - 即我正在查看非抽样数据。
另一个奇怪的事情是,配置文件中的网页浏览量高于过滤器,而过滤器与配置文件的访问者数量较高。我还在配置文件中应用了一个过滤器来强制它使用样本数据 - 我再次得到与过滤器和段数据非常相似的结果。
profile filter segment filter@profile
unique 25550 37778 36433 37971
pageviews 202761 184130 n/a 202761
我想要实现的目标是找到一种方法,在我用完个人资料时,可以获得有关独特访问者的准确数据。
可以在此google文档中找到更多有差异的数据:https://docs.google.com/spreadsheet/ccc?key=0Aqzq0UJQNY0XdG1DRFpaeWJveWhhdXZRemRlZ3pFb0E
答案 0 :(得分:4)
谷歌分析(免费版)每月只跟踪10百万页面交互[0](网页浏览量和事件,以“轨道”开头的任何跟踪器方法是交互)[1],因此可能是您较大网站的数据已经大量采样(我想你们每个人中有500万人有两次以上的互动)[2]。临时报告最多只使用1 mio数据点,因此您可以获得样本样本。当然,聚合值越大,样本量越小。
而且我非常确定数据限制也适用于api访问(Google表示“无法保证将会处理多余的匹配”),因此对于大型网站,api会返回采样(或不完整)数据也是 - 所以你不能真正看到非抽样数据。
至于差异,我会说不同的临时报告使用不同的样本,所以你最终会得到不同的结果。使用GA,你不应该过多地依赖绝对数字,而是要看更多的一般趋势。
[1] Analytics Premium每月跟踪50百万次互动(并得到谷歌的支持),但每年的收入为15万美元
[2] Google建议在大型网站上使用“_setSampleRate()”,以确保您在每月的每一天实际采样数据,而不是在超出数据限制后随机命中或遗漏。
数据限制:
http://support.google.com/analytics/bin/answer.py?hl=en&answer=1070983)。
setSampleRate:
答案 1 :(得分:1)
是的,采样数据不太准确,尤其是访客数量。
我也看到他们在两天内错过了500k的综合浏览量,但几天之后才看到他们出现在他们的报道中。看到不同界面的不同结果也不足为奇。即使他们试图变得更加实时,Google Analytics的质量也会下降。看起来他们的代码库在API中是不一致的,他们的算法遍布地图。
我通常坚持使用相同的指标和报告方法,以便我的结果保持相互比较。我还与Gaug.es一起运行GA,作为验证和健全性检查。有了这些额外的数据,我选择了GA最有信心的报告方法,我完全依赖它。