会话计数之间的差异

时间:2019-03-18 15:33:55

标签: session google-analytics google-bigquery

我是Google Analytics(分析)/ Big Query(大查询)领域的新手。我正在尝试了解如何在Big Query中计算会话数,但是我无法从获取的数据中得出答案。

据我了解,

  1. BQ中的每一行=一个会话
  2. BQ中的会话标识符= visitId + fullvisitorId
  3. 由于Google Analytics(分析)会自动过滤掉没有互动事件的会话,因此Google Analytics(分析)会话的数量低于Big Query会话的数量

问题是,当我以此理解运行查询时,会发生这种情况:

  • GA中的会话数= 7.763.228会话
  • 在BQ中具有不同visitId + fullvisitorId = 7.750.579(低于GA的会话,这表明对#3的理解并非如此)
  • BQ中的会话总数总计。访问次数= 7.763.228(与GA相同)
  • 行数= 7.763.592(因为其中包括364个访问量为NaN的会话)

我想知道的是,我最信任哪些数据,以及每个会话的真正唯一标识符是什么(因为数字不相等)。

此外,我注意到visitId + fullvisitorId并没有为我提供会话的唯一标识符,因为我在数据中重复了13.013 visitId + fullvisitorId。有人有任何想法或解释吗?

谢谢。

1 个答案:

答案 0 :(得分:0)

在Google Analytics(分析)中,会话每天在午夜休息,因此您没有交叉会话。在这些情况下,visitId字段(仅表示用户会话何时开始的时间戳)仍然与第一个会话具有相同的值。因此,如果确实超过了午夜限制,则可以使用相同的fullVisitorId + visitId组合进行两个会话。

如果您需要一个与Google Analytics(分析)中数据匹配的唯一标识符,则应使用visitStartTime + fullVisitorId。 visitStartTime与visitId的工作原理相同,但是如果会话在午夜中断,则会再次设置。正如您已经指出的那样,您还需要过滤totals.visits不同于1的行。

不幸的是,我不知道有任何官方资源指出这一区别,但是社区讨论和测试都证实了这一点。