从Node.js Scraper下载自动下载链接中的PDF

时间:2014-07-09 18:32:14

标签: node.js download scrape

我正在使用Node.js(使用Request.js和Cheerio.js)制作一个刮刀,并导航下载链接以下载PDF并将其添加到我的计算机上的文件夹中。链接会自动开始下载,他们不会导航到渲染的PDF,所以我不知道如何将下载管道从Node传输到该文件夹​​。

1 个答案:

答案 0 :(得分:1)

我不确定渲染的PDF是什么意思,但是如果你知道文档的url只是发送一个ajax调用来获取原始数据,并将其转储到输出文件。

所以这里用Nodejs编写文件。 Writing files in Node.js

示例来自: http://www.sitepoint.com/making-http-requests-in-node-js/

var request = require("request");
var fs = require("fs");

request("http://www.sitepoint.com").pipe(fs.createWriteStream("jspro.htm"));