我正在尝试使用GA过滤掉某些网页。我需要区分这样的页面:
www.example.com/hotel/hotelfoofoo
和此:
www.example.com/hotel/hotelfoofoo/various-options-go-here?lots-of-other-stuff-follows
我是regex的新手,所以我知之甚少,但我基本上是在尝试捕获以/hotel/
开头但不包含任何其他正斜杠的网页。有没有办法写这段代码?
答案 0 :(得分:0)
两种可能的解决方案:
1)假设酒店名称中只允许使用字母数字+' - '符号:
/hotel/([-\w]+)(?![-\/\w])
注意:酒店名称将在第一组中被捕获。这里的想法 - 捕获所有数字/字母/下划线/ - 没有斜线的符号。
2)假设指定url end所需的空格符号:
/hotel/([^\s/]+)(?=\s)
注意:根据您的正则表达式语言,某些字符应该被转义。对于js,所有“/”都应该被转义,例如:“/”