在HTML页面中查找文件链接并自动下载文件

时间:2011-01-25 11:53:37

标签: .net file download browser controls

我必须下载数百个由“< a href:”FileUrl“... />”表示的文件在几个网页中。

我尝试使用.NET Webbrowser控件构建一个.NET程序,打开一个URL(包含链接的页面),提取文档的源代码,找到链接...... 这一切都是朦胧的,没问题。

现在,当我找到一个链接并指示webbrowser导航到该文件链接后,我会看到一个对话框来保存文件(或打开它)等。

对于一个或两个文件没问题。对于数百人来说,我需要自动完成这个过程。

此外,当我用Firefox打开链接时,文件(文本文件)的内容在浏览器中显示,而不是DOWNLOADED,这对我来说没问题,因为那时我可以读取“源”(即文件)文本格式的内容)并将其作为文件保存到磁盘。

有任何线索吗?或者也许有一些现有的实用工具可以完成这项工作?

1 个答案:

答案 0 :(得分:0)

发现它!

用VB编写的一个非常简洁的.NET HTTP下载器类。唯一的问题是它用法语写的(但我是法国人介意你......: - )。

这是:

http://www.vbfrance.com/codes/NET2-CLASSE-TELECHARGEMENT-HTTP-AVEC-GESTION-RESUME-PROGRESSION_41850.aspx

通过一些调整,您可以安排samplehttp下载程序以静默方式下载所有传递的文件URL,甚至通过一些进度事件来管理进度。

该类可以选择性地管理用户凭据并恢复中断的大文件下载。