为ga_realtime_sessions表创建仅追加重复数据删除查询

时间:2018-12-19 10:30:45

标签: google-analytics google-bigquery

因此,我设法通过以下查询将默认的ga_realtime_sessions_view_(传统SQL)转换为标准SQL,基本上是对旧查询的转换,并已过滤为今天的日期:

SELECT
  *
FROM
  `river-island-clothing-co-ltd.12345678.ga_realtime_sessions_2*`
WHERE
  exportKey IN (
  SELECT
    exportKey
  FROM (
    SELECT
      exportKey,
      exportTimeUsec,
      MAX(exportTimeUsec) OVER (PARTITION BY visitKey) maxexportTimeUsec
    FROM
      `river-island-clothing-co-ltd.12345678.ga_realtime_sessions_2*`
    WHERE
      PARSE_DATE("%Y%m%d", date) = CURRENT_DATE())
  WHERE
    exportTimeUsec >= maxexportTimeUsec)

这很好,但是,我想从此查询的结果开始创建分区表,但只能采用追加方式。如果我以write_truncate的方式每15分钟运行一次,则可以正常运行,但当流量较高且我们有多个GA数据集时,最终会花费很多。

我想知道有人能解决这个问题吗?

0 个答案:

没有答案