从整个WebSite中提取所有URL

时间:2011-04-06 09:35:31

标签: c# vb.net web-crawler

我想使用C#或VB.NET抓取网站。我希望抓取工具从网页中提取网址,我也希望抓取工具跟踪网址,以便我能够从网站中提取所有网址。

我怎么写这个?

1 个答案:

答案 0 :(得分:1)

在这种情况下,什么是网站?

本地虚拟目录? 一个静态网页? 动态页面托管在哪里?

看看

wget --mirror

Curl也可以在这里有选择。

此外,请在开始抓网之前阅读robots.txt:)