我从一个使用ajax加载URL并且不允许连续下载的站点下载研究项目的信息。我将casperjs
中的网址转储到我阅读的文件中,并使用browser.retrieve(url,dump_filename)
下载mechanize
的信息。我主要获得空白文件下载,但它们会定期填充内容。有没有办法修改标题,以便我总能获取数据。此外,欢迎使用casperjs
下载替代方案。我尝试了casperjs
download()但它也保存了一个空白文件。我认为它与标题有关。文件下载始终在浏览器中运行。
答案 0 :(得分:0)
当涉及使用AJAX,JS等的更“复杂”的网站时,我更喜欢Selenium而不是Mechanize。
当您使用浏览器时,您说下载有效。 Selenium做同样的事情 - 它在你的桌面上使用Firefox来完成它的任务