如何通过GhostDriver(selenium)使用PhantomJS运行网页代码

时间:2014-04-17 05:51:48

标签: python selenium phantomjs ghostdriver

我通过PhantomJS寻找与GhostDriver合作的能力渲染pdf,而不仅仅是渲染pdf。当我使用下一个代码时,页面正常加载:

from selenium import webdriver

driver = webdriver.PhantomJS('./node_modules/phantomjs/bin/phantomjs')
driver.set_window_size(1024, 768)
driver.get('http://stackoverflow.com')

当我通过命令行https://github.com/ariya/phantomjs/blob/master/examples/rasterize.js使用下一个脚本时,pdf生成完美。

现在我希望执行类似rasterize.jspage.render('file.pdf'))的脚本,但要通过webdriverwebdriver具有execute_script方法,但它看起来像PhantomJS代码评估,无法访问webpage实例上下文。另外webdriverget_screenshot_as_base64方法,但它只返回png。

我使用seleniumphantomjsnodejs的最新版本。

所以我的问题是如何通过PhantomJS访问GhostDriver网页实例并评估render方法?

1 个答案:

答案 0 :(得分:9)

使用下一个命令有一种从GhostDriver执行PhantomJS脚本的特殊方法:

POST /session/id/phantom/execute

它已包含在GhostDriver v1.1.0中,因此它应该从PhantomJS v.1.9.6开始工作。

看看这个例子:

def execute(script, args):
    driver.execute('executePhantomScript', {'script': script, 'args' : args })

driver = webdriver.PhantomJS('phantomjs')

# hack while the python interface lags
driver.command_executor._commands['executePhantomScript'] = ('POST', '/session/$sessionId/phantom/execute')

driver.get('http://stackoverflow.com')

# set page format
# inside the execution script, webpage is "this"
pageFormat = '''this.paperSize = {format: "A4", orientation: "portrait" };'''
execute(pageFormat, [])

# render current page
render = '''this.render("test.pdf")'''
execute(render, [])

请注意,在OS X PhantomJS renders web page as images中,由于OS X中的Qt渲染引擎的限制(至少使用PhantomJS v.1.9.8及更早版本),因此文本不可选。