能够在python for Windows中解释Javascript的Web爬虫

时间:2011-02-14 23:34:35

标签: python webkit gecko

我的最终目标是构建一个能够下载网页上所有图像的网络爬虫。我从阅读中得到的理解是,我需要嵌入一个渲染/布局引擎,如Gecko或Webkit。

不幸的是,我正在运行windows,所以PyWebkit is out和简短的学习C ++ for Gecko或Java使用Rhino,我不知道该转向何处。

是否有可靠的渲染引擎,其中包含可在Windows(64位,Windows 7)中运行的python绑定?有没有一种简单的方法在Windows上的python脚本中执行javascript?

1 个答案:

答案 0 :(得分:3)

您不需要Webkit来执行此操作。您只需要一个运行Javascript代码的引擎,所以请查看Gogole V8Mozilla SpiderMonkey

如果您更喜欢使用Python来构建爬虫,则可能需要使用PyV8,因为它提供了所有必要的绑定。