我正在创建sharepoint抓取规则,以忽略抓取过程中的某些网址。
我想忽略这一点:
http://mysite1.com/sites/12345678
但我不想忽略
中的其他文件http://mysite1.com/sites/12345678/documentlibrary1/doc1.docx
etc,etc
由于我不是正则表达式的专家,我在这里问这个问题。 我知道网站网址总是使用8个字符,这样可以提供帮助
感谢任何帮助
答案 0 :(得分:0)
你的正则表达式可以是:
^http:\/\/mysite1\.com\/sites\/.{8}\/.+$