谷歌分析/数据洞察 - 在处理数据之前从网址中间删除字符串

时间:2021-02-24 11:14:01

标签: google-analytics google-data-studio

我有一个包含数千个目录的网站,我试图通过使用以下字段找出最受欢迎的网站

REGEXP_EXTRACT(Page,'(/[^/]+)')

在我之前的问题 here 之后,这很有效,但是 URL 中有一个随机的额外字符串会影响数字。

例如

  • sitename.com/directoryA 返回与
  • 相同的页面
  • sitename.com/randomstring/directoryA

这意味着当我运行我的字段时,一些应该归因于 /directoryA/ 的视图被归因于 /randomstring 并且我的表格报告如下:

  1. /randomstring = 1,000 次观看
  2. directoryA = 800 次浏览
  3. directoryB = 850 次浏览
  4. ...

有谁知道如何清理 Google Data Studio 中的数据,以便在我运行 REGEXP_EXTRACT 代码之前从 URL 中删除 /randomstring?

1 个答案:

答案 0 :(得分:0)

基于 Comments 中原始海报 (Benjamin Heap) 提供的其他详细信息:

<块引用>

字符串不是随机的,每次都是一样的

一种方法是在 REGEXP_REPLACE 之前使用 REGEXP_EXTRACT 函数,因此,下面将起作用(用实际字符串替换 /randomstring):

REGEXP_EXTRACT(REGEXP_REPLACE(Page, "(/randomstring)", ""), "(/[^/]+)")

Editable Google Data Studio Report 和 GIF 详细说明: