RegExp帮助转换超链接

时间:2011-02-16 07:46:38

标签: c# regex url

我正在尝试提出一个正则表达式并尝试了许多组合并搜索以找到将非超链接地址转换为超链接的解决方案。

http://twitpic.com/abcdef http://www.smh.com.au askjhsd www.hotmail.com ks sd 
<a href="http://www.aaaaaaaa.com">aaaaaaaa</a>

我希望http://twitpic.com/abcdefhttp://www.smh.com.auwww.hotmail.com被选中,而不是http://www.aaaaaaaa.com,因为它已经包裹在<a>标记中。

我目前在C#中使用此正则表达式

return Regex.Replace(input, @"(\b((http|https)://|www\.)[^ ]+\b)", 
   @" <a href=""$0"" target=""_blank"">$0</a>", RegexOptions.IgnoreCase);

我不知道如何排除已经包含在<a><img>

中的内容

帮助:)

修改

对于那些稍后阅读的人来说,这是我提出的最终解决方案

/// <summary>
/// Adds to the input string a target=_blank in the hyperlinks
/// </summary>
public static string ConvertURLsToHyperlinks(string input)
{
    if (!string.IsNullOrEmpty(input))
    {
        var reg = new Regex(@"(?<!<\s*(?:a|img)\b[^<]*)(\b((http|https)://|www\.)[^ ]+\b)");
        return reg.Replace(input, new MatchEvaluator(ConvertUrlsMatchDelegate));

    }
    return input;
}

public static string ConvertUrlsMatchDelegate(Match m)
{
    // add in additional http:// in front of the www. for the hyperlinks
    var additional = "";
    if (m.Value.StartsWith("www."))
    {
        additional = "http://";
    }
    return "<a href=\"" + additional + m.Value + "\" target=\"_blank\">" + m.Value + "</a>";
}

1 个答案:

答案 0 :(得分:1)

您可以使用

@"(?<!<\s*(?:a|img)\b[^<]*)(\b((http|https)://|www\.)[^ ]+\b)"

作为你的正则表达式。 negative lookbehind assertion

后视断言解释说:

(?<!       # Assert that it's impossible to match before the current position:...
 <         # a <
 \s*       # optional whitespace
 (?:a|img) # a or img
 \b        # as an entire word
 [^<]*     # followed by any number of characters except <
)          # end of lookbehind