我需要提取字符串中的url

时间:2013-08-23 08:49:13

标签: c# sql

我需要在字符串中提取url。

在我的情况下,html文本在db中,当我得到该文本并需要在文本中找到所有url并插入到另一个表中时,你能给我一种在SQL或C#中找到url的方法。 / p>

2 个答案:

答案 0 :(得分:1)

这是在文本

中查找网址的正则表达式
Regex regx = new Regex("http://([\\w+?\\.\\w+])+([a-zA-Z0-9\\~\\!\\@\\#\\$\\%\\^\\&\\*\\(\\)_\\-\\=\\+\\\\\\/\\?\\.\\:\\;\\'\\,]*)?", RegexOptions.IgnoreCase);

MatchCollection mactches = regx.Matches(txt); 

答案 1 :(得分:0)

其中一种可能的方法是使用正则表达式。第一种方法是从数据库中提取HTML,然后使用正则表达式直接查找链接。第二个选项是首先定位链接标记,然后从中提取URL(再次使用正则表达式)。

在这里,您可以找到有关如何在C#中使用正则表达式的信息: http://msdn.microsoft.com/en-us/library/system.text.regularexpressions.regex.aspx

另一方面,编写正确的正则表达式可能并不那么容易(这取决于URL的复杂程度),但您应该看一下这个问题:regular expression for url

此外,在这里你可以找到很多关于正则表达式的信息(请记住,有些应用程序如RegexBuddy,在测试正则表达式时可以帮助你很多):{{3} }