使用Python机械化下载文件

时间:2012-06-12 17:47:36

标签: python web-scraping mechanize

我正在尝试使用python和mechanize从网站下载文件。我当前的代码成功登录到网站并打开包含下载链接的页面。

下载链接为:https://www.lendingclub.com/browse/browseNotesRawDataV2.action

链接的信息是:

Link(base_url='https://www.lendingclub.com/browse/browse.action', url='/browse/browseNotesRawDataV2.action', text='', tag='a', attrs=[('class', 'master_pngfix'), ('id', 'browseDownloadAllLink'), ('href', '/browse/browseNotesRawDataV2.action')])

我使用follow_link方法点击链接:

br = mechanize.Browser()
br.follow_link(url='/browse/browseNotesRawDataV2.action')

然而,没有任何反应,也没有下载文件。当我登录时在浏览器中打开链接时,它会暂停几秒钟并下载文件。

如何使用Python下载文件?

1 个答案:

答案 0 :(得分:30)

对于任何有兴趣的人来说,这就是解决方案:

br.retrieve('https://www.lendingclub.com/browse/browseNotesRawDataV2.action','l‌​oans.csv')[0]