我正在使用Greasemonkey eariler in the week自动调用某个页面来从网站上抓取一些数据,这有两个原因:
是否有可能将node.js用作Greasemonkey替代方案,因为node.js可以直接在数据库中存储记录,并且不会像Greasemonkey那样直观地加载页面?
此外,我认为node.js更容易使用,因为您不必像使用GreaseMonkey那样将其脚本重新部署到Firefox,从而允许您轻松地在单独的脚本上使用版本控制项目
另一方面,使用node.js来做GreaseMonkey的工作可能只是用锤子砸螺丝,所以我想我会在这里查看是否有误。
答案 0 :(得分:3)
另一方面,使用node.js做GreaseMonkey的工作可能就是用锤子砸螺丝
我会说相反的是真的;我相信你正在使用Greasemonkey来完成服务器端处理库的工作。 Greasemonkey在浏览器中运行,旨在通过在您访问的页面上运行脚本来修改您的Web体验。
实际上,我相信Node.js非常适合这项任务。使用jsdom和node-jquery等库,您可以轻松地对DOM进行JavaScript解析。您可能还希望看一下node.io,一个“分布式数据抓取和处理框架”。最后,您可以查看基于非节点(但仍然是JavaScript)的工具,例如PhantomJS和CasperJS,它们可以执行抓取,DOM操作,屏幕截图等。
答案 1 :(得分:1)
这个问题有点不合理。
Greasemonkey 是客户调整个人浏览体验 客户端 强>
Node.js 是开发人员将应用程序提供给群众(希望如此), 服务器侧 强>
对于 抓取数据 ,以自动化方式,使用Node.js或某些服务器端库(Python运行良好)。
对于您浏览的网页的 “Mashups” ,请使用Greasemonkey。