C#可编程WebCrawler

时间:2011-06-27 16:31:51

标签: c# web-crawler data-extraction

我想从已知的Url中提取特定数据:来自html标签,例如span,a,divs ......!
所以我正在寻找一个用C#编写的WebCrawler的现有库! ......或者其他任何想法。

谢谢!

3 个答案:

答案 0 :(得分:2)

要解析HTML,您可能需要查看HTML Agility Pack。至于从网站抓取HTML,您可以使用WebClient

答案 1 :(得分:0)

This家伙写了一篇关于使用HtmlAgilityPack从C#进行网页抓取的文章,this是一个网页抓取的框架,虽然该项目似乎已经死了,你可以查看它们,看看是否它们符合您的需求。

答案 2 :(得分:0)

很多人都喜欢HtmlAgilityPack