我尝试在Google Analytics中设置Content Groupings using Extraction。
的网址我希望使用正则表达式,只有在URL包含/StockDetail.aspx的情况下,才提取第一个下划线之前的所有内容,不包括任何数字。例如'巴赫曼'
我设法获取以下正则表达式以返回第一个下划线之前的所有内容
^[^_]+(?=_)
。
然而,就我的理解有限而言,这是我能得到的。有谁知道正则表达式会在这里做什么?
非常感谢,
答案 0 :(得分:0)
嗯,你做到了中途。
以这种方式思考:当字符串包含 /StockDetail.aspx 时,您正在寻找提取后跟下划线但不跟随下划线的内容。你知道字符串的这一部分总是在你的第一个下划线之后。
所以你开始之前没有下划线:[^_]
然后,您创建要与([a-zA-Z]*)
匹配的组(您不能使用\ w,因为它包括下划线)。您的字符串必须后跟下划线,以便在您的论坛后添加_
。在网址的某个地方你已经/StockDetail.aspx
了。你的正则表达式应该是这样的:
[^_]([a-zA-Z]*)_.*(?:\/StockDetail\.aspx)