用于Google Analytics内容分组的正则表达式提取

时间:2015-11-26 14:16:19

标签: regex google-analytics

我尝试在Google Analytics中设置Content Groupings using Extraction

我的格式为http://www.ehattons.com/52674/Bachmann_Branchline_37_671_Pack_of_3_14_Ton_tank_wagons_in_Fina_livery_weathered/StockDetail.aspx

的网址

我希望使用正则表达式,只有在URL包含/StockDetail.aspx的情况下,才提取第一个下划线之前的所有内容,不包括任何数字。例如'巴赫曼'

我设法获取以下正则表达式以返回第一个下划线之前的所有内容

^[^_]+(?=_)

然而,就我的理解有限而言,这是我能得到的。有谁知道正则表达式会在这里做什么?

非常感谢,

1 个答案:

答案 0 :(得分:0)

嗯,你做到了中途。

以这种方式思考:当字符串包含 /StockDetail.aspx 时,您正在寻找提取后跟下划线但不跟随下划线的内容。你知道字符串的这一部分总是在你的第一个下划线之后。

所以你开始之前没有下划线:[^_] 然后,您创建要与([a-zA-Z]*)匹配的组(您不能使用\ w,因为它包括下划线)。您的字符串必须后跟下划线,以便在您的论坛后添加_。在网址的某个地方你已经/StockDetail.aspx了。你的正则表达式应该是这样的:

[^_]([a-zA-Z]*)_.*(?:\/StockDetail\.aspx)

Result