匹配url root但不匹配里面的文件

时间:2014-04-09 14:32:09

标签: regex

我正在创建sharepoint抓取规则,以忽略抓取过程中的某些网址。

我想忽略这一点:

http://mysite1.com/sites/12345678

但我不想忽略

中的其他文件
http://mysite1.com/sites/12345678/documentlibrary1/doc1.docx
etc,etc

由于我不是正则表达式的专家,我在这里问这个问题。 我知道网站网址总是使用8个字符,这样可以提供帮助

感谢任何帮助

1 个答案:

答案 0 :(得分:0)

你的正则表达式可以是:

^http:\/\/mysite1\.com\/sites\/.{8}\/.+$