我对这个GA问题感到困惑。我有许多自定义维度,包括用户标识符,浏览器时间戳和部分名称。我正在使用带有Python的v4 API从GA下载结果。
当我下载用户ID(以及ga:eventCategory,ga:eventAction和ga:eventLabel)时,我会在一天内获得大约12K行,我认为这是正确的。当我添加时间戳时,数字会按预期增加到大约15K行。
但是当我添加最终自定义维度,部分名称时,数字减少。据说这个维度总是被传递和定义。
这对我来说是违反直觉的。当另一个维度添加到批量查询时,为什么行数会减少?
答案 0 :(得分:0)
这里的问题是最终自定义维度不始终定义。因此,当我将其他维度添加到批处理查询时,行未在未定义维度的位置丢失。
这应该在Google Analytics文档中用大写字母拼写:如果您没有定义维度,那么在查询该维度时您将丢失该行。永远不应该有一个空值,而是使用像UNDEFINED这样的东西。然后,您可以在下载中搜索该关键字。
为了找到这个问题,我将所有结果(最终维度除外)下载到文件 all_but_section.csv 。然后,我将最终维度的所有结果下载到文件 all_with_section.csv 。我从CSV中删除了部分列。有点UNIX技巧,这将为您提供缺少维度的行:
cat all_but_section.csv all_with_section.csv | sort | uniq -u
如果有人感兴趣,我还可以提供一个我为提取列而构建的python脚本。