Python-Selenium-Chromedriver在AWS-EC2 Ubuntu上提供ConnectionResetError

时间:2018-01-07 02:05:18

标签: python-3.x amazon-ec2 selenium-chromedriver ubuntu-16.04

我有一个使用Selenium / Chromedriver的应用程序,无头地运行chrome。在我的本地机器上,它完美运行。当尝试在Ubuntu 16.04的AWS-EC2实例上运行时,每次都会出错;

ConnectionResetError: [Errno 104] Connection reset by peer

安全组的出站规则允许所有端口上的所有流量。

由同行错误重置表明我被服务器锁定了,但我无法解释为什么我仍然可以在本地运行?有关错误来源的任何见解吗?

设定:

  • Python 3.6
  • Chromedriver 2.34
  • Selenium 3.8.1

注意:使用来自同一服务器的Robobrowser完成没有问题。

SteveJ

1 个答案:

答案 0 :(得分:0)

使用以下代码,我取得了一定的成功。请注意,它仍然非常挑剔...似乎在一个驱动程序会话后,服务器停止了连接(我们看到104错误)。

首先,请确保下载适当的chromedriver。请遵循以下要点:https://gist.github.com/ziadoz/3e8ab7e944d02fe872c3454d17af31a5

接下来,运行/ usr / local / bin / chromedriver启动chomedriver。您应该看到:

启动ChromeDriver 2.40.565383

接下来,打开一个新的Putty控制台并设置WebDriver。我的首选设置是:

from selenium.webdriver.chrome.options import Options
from selenium.webdriver.chrome.webdriver import WebDriver

chrome_options = Options()
chromes_options.set_headless()

driver=WebDriver('/usr/local/bin/chromedriver',chrome_options=chrome_options)
## Note the above 'executable path' of the chromedriver is based on the above gist
driver.get('https://google.com')

希望这很有用。

其他疑难解答可能包括:

++确保已为您的google-chrome分配了公钥(如此处:https://krbnite.github.io/Driving-Headless-Chrome-with-Selenium-on-AWS-EC2/#comment-3951560468

++将以下标志传递给您的Chrome选项:   '--no-sandbox'和'--disable-dev-shm-usage'

++确保在运行脚本后执行“ sudo killall -9 chrome”,以确保您的chromedriver实例消失了!