使用python在Web中自动下载

时间:2019-09-09 04:31:57

标签: python python-3.x web-scraping

我有一个脚本,该脚本将登录到站点,然后单击一个链接,然后需要将数据导出到excel文件。

该脚本已登录该站点 下载部分缺少

with requests.Session() as s:
  url="https://website"
  r=s.get(url,headers=headers)
  soup=BeautifulSoup(r.text,"lxml")
  login_data['grpstub']=soup.find('input' , attrs={'name':'grpstub'})['value']
  login_data['__VIEWSTATE']=soup.find('input' , attrs={'name':'__VIEWSTATE'})['value']
  login_data['__VIEWSTATEGENERATOR']=soup.find('input' , attrs={'name':'__VIEWSTATEGENERATOR'})['value']
  login_data['__VIEWSTATEENCRYPTED']=soup.find('input' , attrs={'name':'__VIEWSTATEENCRYPTED'})['value']
  login_data['__EVENTVALIDATION']=soup.find('input' , attrs={'name':'__EVENTVALIDATION'})['value']
  r = s.post(url,data=login_data,headers=headers)
  print(r.content)

我需要一个脚本,可以将以下内容导出为ex​​cel

click to see image

1 个答案:

答案 0 :(得分:2)

BeautifulSoup用于提取/解析html和xml。

如果要在网页上自动执行操作(单击按钮/输入表单等),则应使用Selenium之类的东西。

这样,您可以在页面结构中找到一个元素(硒具有很多内置的选择器)并发出值(表单输入)或事件(单击)等。