Question

基本上我正在尝试编写一个脚本，它会抓取网页上的某些文件并将其下载到特定文件夹。

我可以使用Python，Selenium和FirefoxPreferences完成大部分网页。

然而，当我试图抓住这个特定的网页时，由于凭据权限，我无法解析html。

这是一个问题。我能够获取该文件的下载链接，我可以打开浏览器并弹出打开/保存小部件。但是我无法再点击或实际关闭文件。我已经将Firefox首选项设置为不显示此小部件，自动下载和特定文件。由于某种原因，这会被忽略，我仍然盯着打开的浏览器，使用保存/打开小部件。

如何使用Python将文件的下载链接下载到特定文件夹... Selenium ...任何其他相关的CS技巧。我不想构建一个机器人来为我点击保存。太“hacky”，这是一个公司项目。

谢谢！

Answer 1

你可以试试urllib

urllib.urlretrieve(<url>,<filename_with_path>)

Answer 2

import urllib

testfile = urllib.URLopener()
testfile.retrieve("http://randomsite.com/file.gz", "file.gz")

使用python下载文件的好方法。请参阅Here