标签: c# regex html-parsing
获取网页中所有网址数组的最佳方法是什么?我该怎么做?
答案 0 :(得分:2)
使用HTML Agility Pack是good way,可能不是最好的,因为这会是主观的,但我可以告诉你最坏的情况,这是使用正则表达式来解析html(因为你已经标记了你的问题)与regex我觉得自己有义务指出这一点。
regex
答案 1 :(得分:1)
您正在尝试的是HTML抓取。有关C#中的实现详细信息,请查看此link。
答案 2 :(得分:0)
/<a href=\"([^\"]*)\">(.*)<\/a>/iU
或使用此前的答案:
Regular expression for parsing links from a webpage?