我有一个脚本,该脚本将登录到站点,然后单击一个链接,然后需要将数据导出到excel文件。
该脚本已登录该站点 下载部分缺少
with requests.Session() as s:
url="https://website"
r=s.get(url,headers=headers)
soup=BeautifulSoup(r.text,"lxml")
login_data['grpstub']=soup.find('input' , attrs={'name':'grpstub'})['value']
login_data['__VIEWSTATE']=soup.find('input' , attrs={'name':'__VIEWSTATE'})['value']
login_data['__VIEWSTATEGENERATOR']=soup.find('input' , attrs={'name':'__VIEWSTATEGENERATOR'})['value']
login_data['__VIEWSTATEENCRYPTED']=soup.find('input' , attrs={'name':'__VIEWSTATEENCRYPTED'})['value']
login_data['__EVENTVALIDATION']=soup.find('input' , attrs={'name':'__EVENTVALIDATION'})['value']
r = s.post(url,data=login_data,headers=headers)
print(r.content)
我需要一个脚本,可以将以下内容导出为excel
答案 0 :(得分:2)
BeautifulSoup用于提取/解析html和xml。
如果要在网页上自动执行操作(单击按钮/输入表单等),则应使用Selenium之类的东西。
这样,您可以在页面结构中找到一个元素(硒具有很多内置的选择器)并发出值(表单输入)或事件(单击)等。