Python文件下载

时间:2012-04-05 06:05:09

标签: python

我遇到了问题而且不确定这是否可行,所以如果有人能指出我正确的方向。

我需要从网页打开一个文件,在excel中打开它并保存文件。

我在网站上运行文件名的问题有一个文件名(不是活动链接),然后它会有一个“下载”按钮,不是我需要下载的文件所特有的。因此,下载按钮不是“file1todaysdate”,而是我每天都可以使用它们。

有没有办法找到文件名然后从下载图标中获取文件?然后保存在excel?如果不是抱歉浪费时间。

3 个答案:

答案 0 :(得分:2)

我想你要问的是如何在网页上搜索一些不是链接的文本,请求链接,保存文件。

BeautifulSoup通常用于此目的。

但是,requests是另一个可用于获取页面然后获取内容以供以后分析的库。

答案 1 :(得分:2)

按下“下载”时,文件实际来自何处?首先获取该下载链接。如果很难从浏览器中检测到,请使用firebug之类的工具来获取下载链接。一旦你得到它。您可以使用Python使用urllib.urlretrieve

下载它
filename, msg = urllib.urlretrieve('http://yourlinktodownload/file.xls')

文件名将指向已下载的文件。如果是xls格式,它应该在excell中打开。

答案 2 :(得分:0)

检查响应的Content-Disposition标题,以发现服务器要求您调用文件的内容。