从HTML文本中获取链接的值

时间:2011-12-09 14:58:07

标签: c# regex

我有一些很长的HTML文本,如下所示:

/*stuff*/
<a href="some/link.html">Link</a>
/*stuff*/

如何裁剪此选项以便仅获取some/link.html文字?

3 个答案:

答案 0 :(得分:2)

考虑查看Html Agility Pack.

答案 1 :(得分:0)

MatchCollection matches = Regex.Matches(html, @"(?<=<a\s+href="").*?(?="">)");

应该这样做。

请注意,我使用模式(?<=prefix)find(?=suffix):\ n prefix = <a\s+href="
find = .*?
后缀= ">

答案 2 :(得分:-1)

使用jquery可以执行following

var pageNum = $("a#specificLink").attr("href").match(/page=([0-9]+)/)[1];

和.net c#this tutorial可能会指导您正确的方向。