所以我有一个网站,每天它会生成一个包含统计信息的excel文件。 为了下载文件,我必须点击一个按钮,然后返回文件(通过表单调用生成)。
有没有办法用python或其他脚本语言自动完成? 我想下载excel文件2年,我不想每次点击下载按钮(从日历或网址更改地址后)
我尝试过网络抓取,但没有任何对我有用。 我不知道每天都有确切的网址。
如果我理解正确,网站就在Drupal中
答案 0 :(得分:0)
1。
您可以使用requests
模块发送POST / GET请求,当您单击按钮时,该请求可能是相同的消息。这是给你的指导。 http://docs.python-requests.org/en/latest/
2。
您可以使用Selenium
来帮助您,这是一种模拟浏览器的工具,允许您同时控制真实的Web浏览器。这是给你的指导。 http://docs.seleniumhq.org/
3。
您也可以使用urllib/urllib2
来模拟此点击操作。但它并不那么容易使用。
希望它有所帮助。 :)