如何排除正则表达式中的字符

时间:2013-10-31 20:38:42

标签: regex regex-negation

我有这个正则表达式

UriPatternToMatch= new Regex(@"(href|src)=""[\d\w\/:#@%;$\(\)~_\?\+\-=\\\.&]*", 
RegexOptions.Compiled | RegexOptions.IgnoreCase)

这适用于拾取包括http,ftp等在内的所有网址,但它会在"&lt"个特殊字符中选择文字作为网址

例如它会错误地将下面的文字作为网址(在下面添加照片而不是文字)

snapshot

我相信^& lt是需要的东西,但我在哪里添加它?

由于

1 个答案:

答案 0 :(得分:1)

你需要使用这样的负向前瞻:

(?!.*?<)