获取网页中所有网址的列表

时间:2010-09-04 10:51:38

标签: c# regex html-parsing

获取网页中所有网址数组的最佳方法是什么?我该怎么做?

3 个答案:

答案 0 :(得分:2)

使用HTML Agility Packgood way,可能不是最好的,因为这会是主观的,但我可以告诉你最坏的情况,这是使用正则表达式来解析html(因为你已经标记了你的问题)与regex我觉得自己有义务指出这一点。

答案 1 :(得分:1)

您正在尝试的是HTML抓取。有关C#中的实现详细信息,请查看此link

答案 2 :(得分:0)

/<a href=\"([^\"]*)\">(.*)<\/a>/iU

或使用此前的答案:

Regular expression for parsing links from a webpage?