我正在尝试下载(或打开并保存)大约30,000个PDF文档。仅可通过第三方服务提供商的网站/平台访问的文档(此处不存在道德困境)。
该网站是安全的,需要登录(我有权访问),并且该表是通过AJAX生成的。我打算从中读取的报告的URL格式为https://sub.website.com/au/report/index?id=1001#,当日期或其他过滤器发生更改时,URL不会更改。总共有180,000多个表条目,不是全部都有关联的发票,也不是所有发票都是必需的。
使用Chrome DevTools,我可以看到元素;表格名称为#reportResults,发票详细信息位于html元素中。
似乎也有一个API,但我也不知道从哪里开始。
如何使用VBA从中抓取数据?我已经下载了其他解决方案中推荐的JSON.bas模块,用于抓取JSON和AJAX。但是对于这种情况,我不知道如何使用它以及从这里去哪里。
我很熟悉VBA,但是没有任何其他语言的经验。