刮除AJAX生成的表以批量下载PDF

时间:2018-10-18 00:50:08

标签: json ajax excel vba web-scraping

我正在尝试下载(或打开并保存)大约30,000个PDF文档。仅可通过第三方服务提供商的网站/平台访问的文档(此处不存在道德困境)。

该网站是安全的,需要登录(我有权访问),并且该表是通过AJAX生成的。我打算从中读取的报告的URL格式为https://sub.website.com/au/report/index?id=1001#,当日期或其他过滤器发生更改时,URL不会更改。总共有180,000多个表条目,不是全部都有关联的发票,也不是所有发票都是必需的。

Maintenance Activity report screenshot

使用Chrome DevTools,我可以看到元素;表格名称为#reportResults,发票详细信息位于html元素中。

Table element with Chrome DevTools

似乎也有一个API,但我也不知道从哪里开始。

enter image description here

如何使用VBA从中抓取数据?我已经下载了其他解决方案中推荐的JSON.bas模块,用于抓取JSON和AJAX。但是对于这种情况,我不知道如何使用它以及从这里去哪里。

我很熟悉VBA,但是没有任何其他语言的经验。

0 个答案:

没有答案