如何处理BQ GA出口变更?

时间:2016-11-17 12:21:59

标签: google-analytics google-bigquery

我正在尝试重新处理ga_sessions_yyyymmdd数据,但我发现ga_sessions从未使用过一个名为[channelGrouping]的字段,但它确实存在于更新的数据中。

所以我的工作对于最新版本的ga_sessions工作正常但是当我尝试重新处理earleir ga_sessions数据时,作业失败,因为它缺少[channelGrouping]字段。

显然,这通常是你想要的,但在这种情况下并非如此。我想确保我坚持使用最新的ga_sessions模式,并希望将缺少的cols设置为null,因为它们不存在时。

有什么方法吗?

也许我需要创建一个名为ga_sessions_template_latest的空表并将其与我正在处理的每日ga_sessions_表联合起来 - 也许这会将旧的ga_sessions'升级'到新结构。

附件是我的意思的截图(由于ga_sessions中的嵌套字段,我的工会想法实际上会很糟糕)。 enter image description here

1 个答案:

答案 0 :(得分:1)

我还没有这样的剧本。但由于表格在您的项目下,您可以更新它们。您可以编写脚本并在最新模式集中缺少列的所有表上更新模式。

  • 我设想了一个获取最新表模式的脚本。
  • 然后一个接一个地返回到过去的表,进行比较,识别缺失的列,将它们定义为不需要和可空,并读取模式+应用其他列并在表上运行更新。数据不会被修改,您将只有其他具有空值的列。

您也可以通过Web UI尝试一些。