解析文本并转换链接

时间:2010-06-29 15:40:50

标签: .net regex

有没有人知道一个好的图书馆在那里拿一串文字和使用正则表达式(或任何你想要的)来解析链接的任何网址?例如:

输入:我发现这个名为google.com的网站很棒。您可以通过webmaster@google.com向网站管理员发送电子邮件。

输出:我发现这个名为&lt; a href =“http://google.com">google.com</a&gt;的网站很棒。您可以通过以下网址发送电子邮件给网站管理员:&lt; a href =”mailto:webmaster@google.com“&gt;网站管理员@ google.com&LT; / A&GT;

1 个答案:

答案 0 :(得分:1)

我不知道任何固定的解决方案,但你可以制作一个快速的脚本。我发现了一些正则表达式来挑选网址,请参阅:http://flanders.co.nz/2009/11/08/a-good-url-regular-expression-repost/

对于电子邮件地址,\ b [A-Z0-9 ._% - ] + @ [A-Z0-9 .-] +。[A-Z] {2,4} \ b。

从那里开始,使用mailto:或http://添加前缀并添加链接标记应该是微不足道的(我使用perl)。