我知道这可能是一个非常愚蠢的问题,但是,由于我是Javascript的新手,我不确定如何做到这一点。我想编写一个脚本并在我的笔记本电脑上通过node
运行它,并且在这个脚本中,我想与一个网页进行交互,以便使用像document.getElementById
这样的函数。
在Python中,可以使用Beautiful Soup
或requests
之类的东西来做到这一点,但是你如何在Javascript中做到这一点?
答案 0 :(得分:1)
我已经使用cheerio和request-promise实现了一个爬虫程序,如下所示:
https://www.npmjs.com/package/cheerio
let request = require('request-promise');
let cheerio = require('cheerio');
request = request.defaults({
transform: function (body) {
return cheerio.load(body);
}
});
// ... omitted
request({uri: 'http://example.org'})
.then($ => {
const element = $('.element-with-class');
});