c# - 基于.Net的网络爬虫示例 - Thinbug

基于.Net的网络爬虫示例

时间：2009-09-17 16:40:18

标签： c# .net visual-studio-2008 web-crawler search-engine

我正在使用VSTS 2008 + C＃+ .Net 3.5。我想找一个抓取网站所有网页的工具（开源），以及通过这个网站链接的任何其他域页面，我想跳过抓取它们（我只需要这个特定域的页面）只要）。对于已爬网的网页，我想将它们存储到本地文件目录中。

任何样品或随时可以使用的开源工具？

2 个答案:

答案 0 :(得分：4)

Arachnode.net可能就是你要找的东西。

答案 1 :(得分：3)

我是AN的作者。

AN默认为所有语言编制索引。无需配置。

麦克