使用selenium和PhantomJS获取Google学术搜索的结果

时间:2017-10-22 18:12:58

标签: selenium web phantomjs

以下代码应打印this页面的内容。

from selenium import webdriver
driver = webdriver.PhantomJS()
link = u'https://scholar.google.co.il/scholar?q=The+Trellis+Security+Infrastructure:+{A}+Layered+Approach+to+Overlay+Metacomputers'
driver.get(link)
print driver.page_source

然而,所有打印的是:

<html><head></head><body></body></html>

如果我使用webdriver.Firefox()代替webdriver.PhantomJS(),则可行。我知道PhantomJS已正确安装,因为上面的代码工作得很好。这意味着什么?

1 个答案:

答案 0 :(得分:1)

您使用的是哪种版本的Selenium / PhantomJs? 我尝试过:

  • Selenium 3.6.0
  • PhantomJs 2.1.1

这样:

from selenium import webdriver

driver = webdriver.PhantomJS(executable_path=r'PathTo/phantomjs-2.1.1-macosx/bin/phantomjs')
link = 'https://scholar.google.co.il/scholar?q=The+Trellis+Security+Infrastructure:+{A}+Layered+Approach+to+Overlay+Metacomputers'
driver.get(link)
print (driver.page_source)

它有效。