初学者,尝试在Python 3.x中编写脚本,每天登录网站后下载文件。该文件嵌入在超链接中,通常在单击下载时,您将获得操作系统弹出窗口,询问保存位置。我似乎有一切工作,除了它下载/写入文件后我打开文件找到消息,“页面无法显示,因为发生了内部服务器错误。”,而不是文件的文本我'我希望找到。在这一点上,我认为可能是超链接可能是问题所在(它每天根据日期变化,所以我已经加入了datetime语句来解释它)。我尝试过使用像BeautifuSoup和Selenium这样的东西,虽然在这里挖了几十个其他帖子,但还没有找到解决方案。虽然他们接近但仍然没有雪茄。想法?
代码:
today = datetime.datetime.now()
todays_file = today.strftime('%Y%m%d')
file_url = 'https://site.url/file.url'
site_url = 'https://site.url'
s = requests.Session()
s.get(site_url)
s.post(site_url,data={'username':’username’,'dept':’dept’,'password':’password’})
the_file = s.get(file_url)
with open(‘file.txt','wb') as f:
f.write(the_file.content)