我想开发一个asp.net页面,通过它我可以指定包含许多文件和链接的任何页面的URL。目录。我想全部下载它们。类似于FireFox的DownThemAll插件。
即
“MyPage.htm”文件包含许多指向位于同一服务器上的文件/目录的链接。
现在我想编写一个可以下载所有这些文件的函数,如果我提供
“www.mycustomdomain.com \ Mypage.htm”作为输入。
我希望问题很明确。
答案 0 :(得分:1)
希望我理解你的问题。您有一个带有链接列表的HTM文件,这些链接是指向远程服务器上特定文件的链接,您想要下载所有文件。
没有失败证明的方法来做到这一点。
检查此问题。 How do you parse an HTML in vb.net尽管这是针对VB.net的,但它与您要求的内容有关。您可以获得一系列链接,然后开始下载文件。
您可以使用Computer.Network.DownloadFile方法下载远程文件,并将其保存在您的位置。
这不是一个失败的prrof方法,因为如果下载需要身份验证,那么它将下载HTML页面[主要是腰部页面]
答案 1 :(得分:1)
以HTML格式获取网页。谷歌(c#从网上获取文件)。第一个链接会给你一个想法。
然后找到正则表达式的链接。 www.x.com中链接的一些示例正则表达式模式应为 (http://www.x.com/。*?) (但如果你还在你的正则表达式模式中包含A标签,那就更好了)
并下载文件,如下所示: http://www.csharp-examples.net/download-files/