标签: c# web-crawler data-extraction
我想从已知的Url中提取特定数据:来自html标签,例如span,a,divs ......! 所以我正在寻找一个用C#编写的WebCrawler的现有库! ......或者其他任何想法。
谢谢!
答案 0 :(得分:2)
要解析HTML,您可能需要查看HTML Agility Pack。至于从网站抓取HTML,您可以使用WebClient。
答案 1 :(得分:0)
This家伙写了一篇关于使用HtmlAgilityPack从C#进行网页抓取的文章,this是一个网页抓取的框架,虽然该项目似乎已经死了,你可以查看它们,看看是否它们符合您的需求。
答案 2 :(得分:0)
很多人都喜欢HtmlAgilityPack。