检索javascript处理的网页

时间:2011-04-03 10:38:03

标签: javascript download

我要求的是能够通过Google Chrome或Firefox下载渲染/处理过的网页。

例如,我不想要:

hendry@x201 ~$ w3m -dump http://hello.dabase.com
FAIL

我想:

$ $answer http://hello.dabase.com
Hello World

5 个答案:

答案 0 :(得分:3)

您应该可以使用PhantomJS来完成此操作。它在没有视觉效果的情况下运行WebKit,但是您可以获得与JavaScript,HTML / DOM,CSS,SVG,Canvas等许多相同的快速和本机支持。

免责声明:我开始使用PhantomJS。

答案 1 :(得分:1)

可能太早了,但有人将V8移植到了Go-lang,所以现在你可以编写自己的客户端来使用这个强大的组合:

http://bravenewmethod.wordpress.com/2011/03/30/embedding-v8-javascript-engine-and-go/

看起来很简单,不需要丑陋的Java / Rhino堆栈并采用下一个大编程语言。

答案 2 :(得分:1)

它看起来类似于http://simile.mit.edu/wiki/Crowbar试图解决的问题。

答案 3 :(得分:0)

您可以使用jsdom: - https://github.com/tmpvar/jsdom

我为它构建了一个节点驱动程序,但它应该与Rhino等一起工作。

答案 4 :(得分:0)

我会看一下Rhino

我将优秀的env.js库与Rhino结合使用,以尽可能地模拟浏览器环境。一旦你实现了一些网络蜘蛛引导代码,你应该能够获得你想要的结果。

我对其他解决方案感兴趣。