在使用beautifulsoup提交表单后从网站下载pdf

时间:2016-09-25 14:37:47

标签: python pdf beautifulsoup

我目前正在用python编写一个爬虫脚本。我知道beautifulsoup包并且已经做了一些简单的抓取工具。目前我正在为一个有四个下拉列表的网站编写一个爬虫,如果按下下载按钮选择了四个下拉列表将下载pdf。我已经通过此脚本的请求尝试了它。

post_data = {
'select name 1' : 'value 1',
'select name 2' : 'value 2',
'select name 3' : 'value 3',
'select name 4' : 'value 4',
}   

r = requests.post("http://mydemosite.aspx",data=post_data)

这不起作用。我想使用Beautifulsoup来选择四个下拉列表并制作一个虚拟的formubmit并获得相应的pdf.Is有可能用美丽的汤来实现这个(提交一个表格)。

1 个答案:

答案 0 :(得分:1)

一般情况下,是的,这是可能的,但这实际上取决于目标网站以及提交表单所涉及的内容。

如果这是一个不涉及JavaScript的常规HTML表单,您可以使用RoboBrowserMechanicalSoup这样的包,这样可以轻松提交表单。这些套餐基于requestsBeautifulSoup,您可以访问"汤"对象如果需要的话。