我希望使用vb.net代码从网址下载pdf。 url返回带有嵌入pdf插件的页面。我想要能自动下载并保存pdf的代码。这是一个示例网址 http://www.sigmaaldrich.com/MSDS/MSDS/DisplayMSDSPage.do?country=PK&language=en&productNumber=S9888&brand=SIAL
答案 0 :(得分:0)
使用WebClient这样
下载源网址的HTML源代码 Dim myWebClient As New WebClient()
myWebClient.DownloadFile("http://example.com/somepage.html", "downloadedpage.html")
然后针对此downloadedpage.html
运行regular expression,如下所示:iframe.+src\=\"(.+)\"
:它将返回第一个匹配作为PDF文件的来源。您可以在Regexp Hero
http://example.com
加上您在步骤2
上提取的子网址,撰写PDF文件的最终链接3