多维度的Google AnalyticsAPI下载 - 数量会随着维度的增加而减少

时间:2017-05-02 02:28:19

标签: google-analytics google-analytics-api

我对这个GA问题感到困惑。我有许多自定义维度,包括用户标识符,浏览器时间戳和部分名称。我正在使用带有Python的v4 API从GA下载结果。

当我下载用户ID(以及ga:eventCategory,ga:eventAction和ga:eventLabel)时,我会在一天内获得大约12K行,我认为这是正确的。当我添加时间戳时,数字会按预期增加到大约15K行。

但是当我添加最终自定义维度,部分名称时,数字减少。据说这个维度总是被传递和定义。

这对我来说是违反直觉的。当另一个维度添加到批量查​​询时,为什么行数会减少?

1 个答案:

答案 0 :(得分:0)

这里的问题是最终自定义维度始终定义。因此,当我将其他维度添加到批处理查询时,行未在未定义维度的位置丢失。

这应该在Google Analytics文档中用大写字母拼写:如果您没有定义维度,那么在查询该维度时您将丢失该行。永远不应该有一个空值,而是使用像UNDEFINED这样的东西。然后,您可以在下载中搜索该关键字。

为了找到这个问题,我将所有结果(最终维度除外)下载到文件 all_but_section.csv 。然后,我将最终维度的所有结果下载到文件 all_with_section.csv 。我从CSV中删除了部分列。有点UNIX技巧,这将为您提供缺少维度的行:

cat all_but_section.csv all_with_section.csv | sort | uniq -u

如果有人感兴趣,我还可以提供一个我为提取列而构建的python脚本。