node.js,casperjs和phantomjs之间的区别?

时间:2014-02-23 08:04:59

标签: web screen-scraping

我已经读过这三个用于网页抓取。但最重要的是什么?在什么样的环境中比另一个更好?

1 个答案:

答案 0 :(得分:19)

Nodejs是一款基于Chrome V8引擎的脚本引擎。 Nodejs通常用作Web服务器,但它实际上是一个脚本引擎,可以运行您喜欢的任何类型的脚本。通过向其他服务器发出请求然后分析输出,可以将节点用于Web抓取。

Phantomjs是一个无头webkit浏览器,这意味着它就像浏览器一样,但没有UI。单独使用,它构成了Web测试框架的一部分,但更好地与......一起使用。

Casperjs是一个基于Phantomjs构建的实用程序,可帮助您构建自动化测试。

自动化测试可以看作是一个网络刮板,但实际上并不是它的用途。 Web测试通常对正在被抓取的页面上的更改敏感,并且不必快速进行DOM操作(因为您倾向于一次执行一页)。

我认为nodejs可能是您想要的最佳选择。