基本上我正在尝试编写一个脚本,它会抓取网页上的某些文件并将其下载到特定文件夹。
我可以使用Python,Selenium和FirefoxPreferences完成大部分网页。
然而,当我试图抓住这个特定的网页时,由于凭据权限,我无法解析html。
这是一个问题。我能够获取该文件的下载链接,我可以打开浏览器并弹出打开/保存小部件。但是我无法再点击或实际关闭文件。我已经将Firefox首选项设置为不显示此小部件,自动下载和特定文件。由于某种原因,这会被忽略,我仍然盯着打开的浏览器,使用保存/打开小部件。
如何使用Python将文件的下载链接下载到特定文件夹... Selenium ...任何其他相关的CS技巧。我不想构建一个机器人来为我点击保存。太“hacky”,这是一个公司项目。
谢谢!
答案 0 :(得分:0)
你可以试试urllib
urllib.urlretrieve(<url>,<filename_with_path>)
答案 1 :(得分:0)
import urllib
testfile = urllib.URLopener()
testfile.retrieve("http://randomsite.com/file.gz", "file.gz")
使用python下载文件的好方法。 请参阅Here