我需要一个无头浏览器进行webscraping。最近我尝试了3种不同的无头浏览器( PhantomJS,Firefox,Chrome )。
使用 phantomJS 时,会出现一些错误(即):Armv7处理器需要GUI 。
然后,我正在使用 Firefox与geckodriver ,它会在路径中显示错误并拒绝连接。
所以我转移到带有chromedriver的Chrome无头浏览器,但它也显示与Firefox 相同的错误。
因此,我需要一个适用于Armv7处理器的正确无头浏览器。 任何人都可以建议解决方案或任何其他方式继续前进。
答案 0 :(得分:1)
安装较低版本的selenium修复了我的问题。
pip install selenium==2.53.5
答案 1 :(得分:0)
尝试以下为我工作的程序。
geckodriver v0.19.0建议使用以下版本:
Firefox 55.0(及更高版本) 硒3.5(及更高)
从https://github.com/mozilla/geckodriver/releases下载geckodriver。下载后,将其解压缩并使其可执行(在linux chmod +x path/to/geckdriver
中)。
from selenium import webdriver
geckoPath = 'path/to/geckodriver'
browser = webdriver.Firefox(executable_path=geckoPath)
browser.get('http://stackoverflow.com')
body_html = driver.find_element_by_xpath("/html/body")
print body_html.text