我有一个使用Selenium / Chromedriver的应用程序,无头地运行chrome。在我的本地机器上,它完美运行。当尝试在Ubuntu 16.04的AWS-EC2实例上运行时,每次都会出错;
ConnectionResetError: [Errno 104] Connection reset by peer
安全组的出站规则允许所有端口上的所有流量。
由同行错误重置表明我被服务器锁定了,但我无法解释为什么我仍然可以在本地运行?有关错误来源的任何见解吗?
设定:
注意:使用来自同一服务器的Robobrowser完成没有问题。
SteveJ
答案 0 :(得分:0)
使用以下代码,我取得了一定的成功。请注意,它仍然非常挑剔...似乎在一个驱动程序会话后,服务器停止了连接(我们看到104错误)。
首先,请确保下载适当的chromedriver。请遵循以下要点:https://gist.github.com/ziadoz/3e8ab7e944d02fe872c3454d17af31a5
接下来,运行/ usr / local / bin / chromedriver启动chomedriver。您应该看到:
启动ChromeDriver 2.40.565383
接下来,打开一个新的Putty控制台并设置WebDriver。我的首选设置是:
from selenium.webdriver.chrome.options import Options
from selenium.webdriver.chrome.webdriver import WebDriver
chrome_options = Options()
chromes_options.set_headless()
driver=WebDriver('/usr/local/bin/chromedriver',chrome_options=chrome_options)
## Note the above 'executable path' of the chromedriver is based on the above gist
driver.get('https://google.com')
希望这很有用。
其他疑难解答可能包括:
++确保已为您的google-chrome分配了公钥(如此处:https://krbnite.github.io/Driving-Headless-Chrome-with-Selenium-on-AWS-EC2/#comment-3951560468)
++将以下标志传递给您的Chrome选项: '--no-sandbox'和'--disable-dev-shm-usage'
++确保在运行脚本后执行“ sudo killall -9 chrome”,以确保您的chromedriver实例消失了!