填写表单和下载文件 - 请求和Python

时间:2017-08-31 18:39:17

标签: python web-scraping python-requests downloading

我正在尝试废弃these page。我使用请求库来填写表单。这部分是有效的,因为当我在Dt_Ref表单中更改为假日日期或不是dd / mm / yyyy格式时,我会收到警告。

目标是下载填写表格的结果。

1 - 填写表格 2 - 下载生成的文件

这是代码。

* Ps,我在公司代理下工作,所以我使用HTTPProxyAuth登录我的凭据。

import requests
from requests.auth import HTTPProxyAuth


params = {'Dt_Ref': '20/08/2017', 'TpInstFinanceiro': 'Debentures'}

company_proxy = {"http":"proxy.xxxxx/yyyyyy.pac"}
credenciais = HTTPProxyAuth("qqqqq", "wwwww")

url = 'http://www.anbima.com.br/reune/reune_down.asp'


r = requests.post(url, data = params, proxies = itau_proxy , auth = credenciais)

有关如何下载文件的想法吗?

1 个答案:

答案 0 :(得分:1)

您错过了帖子数据中的一些重要参数。试试这个params词典:

params = {
    'TpInstFinanceiro':'DEB', 'Tipo':'1', 
    'Dt_Ref':'02/08/2017', 'saida':'csv'
}

如果您不想要csv文件,可以更改params['saida']值。