Question

我尝试在Google Analytics中设置Content Groupings using Extraction。

的网址

我希望使用正则表达式，只有在URL包含/StockDetail.aspx的情况下，才提取第一个下划线之前的所有内容，不包括任何数字。例如＆＃39;巴赫曼＆＃39;

我设法获取以下正则表达式以返回第一个下划线之前的所有内容

^[^_]+(?=_)。

然而，就我的理解有限而言，这是我能得到的。有谁知道正则表达式会在这里做什么？

非常感谢，

Answer 1

嗯，你做到了中途。

以这种方式思考：当字符串包含 /StockDetail.aspx 时，您正在寻找提取后跟下划线但不跟随下划线的内容。你知道字符串的这一部分总是在你的第一个下划线之后。

所以你开始之前没有下划线：[^_] 然后，您创建要与([a-zA-Z]*)匹配的组（您不能使用\ w，因为它包括下划线）。您的字符串必须后跟下划线，以便在您的论坛后添加_。在网址的某个地方你已经/StockDetail.aspx了。你的正则表达式应该是这样的：

[^_]([a-zA-Z]*)_.*(?:\/StockDetail\.aspx)