我正在尝试提出一个正则表达式并尝试了许多组合并搜索以找到将非超链接地址转换为超链接的解决方案。
即
http://twitpic.com/abcdef http://www.smh.com.au askjhsd www.hotmail.com ks sd
<a href="http://www.aaaaaaaa.com">aaaaaaaa</a>
我希望http://twitpic.com/abcdef
,http://www.smh.com.au
和www.hotmail.com
被选中,而不是http://www.aaaaaaaa.com
,因为它已经包裹在<a>
标记中。
我目前在C#中使用此正则表达式
return Regex.Replace(input, @"(\b((http|https)://|www\.)[^ ]+\b)",
@" <a href=""$0"" target=""_blank"">$0</a>", RegexOptions.IgnoreCase);
我不知道如何排除已经包含在<a>
或<img>
帮助:)
修改
对于那些稍后阅读的人来说,这是我提出的最终解决方案
/// <summary>
/// Adds to the input string a target=_blank in the hyperlinks
/// </summary>
public static string ConvertURLsToHyperlinks(string input)
{
if (!string.IsNullOrEmpty(input))
{
var reg = new Regex(@"(?<!<\s*(?:a|img)\b[^<]*)(\b((http|https)://|www\.)[^ ]+\b)");
return reg.Replace(input, new MatchEvaluator(ConvertUrlsMatchDelegate));
}
return input;
}
public static string ConvertUrlsMatchDelegate(Match m)
{
// add in additional http:// in front of the www. for the hyperlinks
var additional = "";
if (m.Value.StartsWith("www."))
{
additional = "http://";
}
return "<a href=\"" + additional + m.Value + "\" target=\"_blank\">" + m.Value + "</a>";
}
答案 0 :(得分:1)
您可以使用
@"(?<!<\s*(?:a|img)\b[^<]*)(\b((http|https)://|www\.)[^ ]+\b)"
作为你的正则表达式。 negative lookbehind assertion。
后视断言解释说:
(?<! # Assert that it's impossible to match before the current position:...
< # a <
\s* # optional whitespace
(?:a|img) # a or img
\b # as an entire word
[^<]* # followed by any number of characters except <
) # end of lookbehind