我正在尝试为网站设置Content Groupings。
我的网址结构如下:
http://website.com/news/2014/3/31/MBB_0331140148.aspx?path=mbball
http://website.com/news/2014/3/31/MBB_0331141819.aspx?path=mbball
http://website.com/news/2014/4/11/MBB_0411140500.aspx?path=mbball
http://website.com/news/2014/4/12/FB_0412140313.aspx?path=football
http://website.com/news/2014/4/14/MBB_0414142539.aspx?path=mbball
http://website.com/news/2014/4/15/MBB_0415145757.aspx?path=mbball
http://website.com/news/2014/4/17/FB_0417140744.aspx?path=football
http://website.com/news/2014/4/17/MBB_0417143800.aspx?path=mbball
http://website.com/news/2014/4/2/MBB_0402140734.aspx?path=mbball
对于RegEx,我使用了以下代码(以匹配所有篮球):
/news/201[0-9]/[0-9]/[0-9][0-9]/.*\.aspx\?path=mbball
我的RegEx是否真的如下才能捕获所有新闻组?
/news/(.*?)/(.*?)/(.*?)/.*\?.*path=([^&]+)
答案 0 :(得分:-1)
.*
将尽可能地抓住所有内容。您已加入?
,这使得明星匹配的次数尽可能少。但是,当您试图捕获所有新闻时,请尝试:
/news/.*?path=[^&]+
这将抓住从新闻到最终的所有内容,包括路径和尽可能多的非&尽可能的角色。