应用错误收集

C＃可编程WebCrawler

时间：2011-06-27 16:31:51

标签： c# web-crawler data-extraction

我想从已知的Url中提取特定数据：来自html标签，例如span，a，divs ......！
所以我正在寻找一个用C＃编写的WebCrawler的现有库！ ......或者其他任何想法。

谢谢！

3 个答案:

答案 0 :(得分：2)

要解析HTML，您可能需要查看HTML Agility Pack。至于从网站抓取HTML，您可以使用WebClient。

答案 1 :(得分：0)

This家伙写了一篇关于使用HtmlAgilityPack从C＃进行网页抓取的文章，this是一个网页抓取的框架，虽然该项目似乎已经死了，你可以查看它们，看看是否它们符合您的需求。

答案 2 :(得分：0)

很多人都喜欢HtmlAgilityPack。