硒铬每隔一次挂起

时间:2019-05-31 15:30:47

标签: python selenium google-chrome-extension

我的selenium chrome脚本每隔运行一次就会挂起,并且仅在使用扩展程序运行时才会挂起,但是我不知道为什么。

我最近遇到了一个似乎使我困惑不解的问题,但似乎并非一无所获。我有一个通过代理服务器在Chrome中运行的python硒脚本,因为它使用用户名/密码组合进行身份验证,而不仅仅是通过IP身份验证,因此我做了一个Chrome扩展程序,驱动程序在开始新会话之前先加载了该扩展程序。

下面是脚本:

import selenium
import selenium.webdriver.common.proxy
import selenium.webdriver.common.desired_capabilities

chrome_options = selenium.webdriver.ChromeOptions()
chrome_options.add_argument("disable-infobars")
chrome_options.add_argument('--ignore-certificate-errors')
chrome_options.add_argument('--ignore-ssl-errors')


prefs = {"profile.default_content_setting_values.notifications" : 2, "profile.managed_default_content_settings.images": 2, "profile.default_content_settings.images":2, 'disk-cache-size': 4096 }
chrome_options.add_experimental_option("prefs",prefs)

add_log_prefs = selenium.webdriver.common.desired_capabilities.DesiredCapabilities.CHROME
add_log_prefs['loggingPrefs'] = { 'browser':'ALL' }

chrome_options.add_argument('--load-extension='+proxy_extension_path)

driver = selenium.webdriver.Chrome(chrome_driver_path,
                                   options=chrome_options,
                                   desired_capabilities=add_log_prefs)

driver.set_window_size(window_size_w, window_size_h)

driver.get('https://www.google.com/')

以下是扩展名:

Manifest.json:

{
    "version": "1.0.0",
    "manifest_version": 1,
    "name": "Chrome Proxy",
    "permissions": [
        "proxy",
        "tabs",
        "unlimitedStorage",
        "storage",
        "<all_urls>",
        "webRequest",
        "webRequestBlocking"
    ],
    "background": {
        "scripts": ["background.js"]
    },
    "minimum_chrome_version":"1.0.0"
}

background.js:

var config = {
        mode: "fixed_servers",
        rules: {
          singleProxy: {
            scheme: "http",
            host: "HOST",
            port: parseInt(PORT)
          },
          bypassList: ["localhost"]
        }
      };

chrome.proxy.settings.set({value: config, scope: "regular"}, function() {});

function callbackFn(details) {
    return {
        authCredentials: {
            username: "USERNAME",
            password: "PASSWORD"
        }
    };
}

chrome.webRequest.onAuthRequired.addListener(
            callbackFn,
            {urls: ["<all_urls>"]},
            ['blocking']
);

我遇到的问题是,当我启动脚本并尝试通过get等方式加载网站时, driver.get(“ https://www.google.com/”),每隔我启动该程序一次,它就会超时,都将导航到该网站。超时后,我可以自己手动进入网站,看起来好像就挂在那里了。

即使我重新运行脚本并清理所有已加载的变量等,也会发生这种情况,但是每隔一段时间我就会遇到一次事实,这表明在脚本执行后有某种方式可以清除一些剩余的设置超时,然后在设法导航到网址时重新设置。

我完全不知所措,并且在这个问题上已经花了数小时进行研究,因此任何建议将不胜感激。

1 个答案:

答案 0 :(得分:1)

使用自定义镶边配置文件是解决此问题的解决方案之一。不要问我如何以及为什么:-)仍然需要对此部分进行调查。

但是,现在,如果要继续使用脚本,请将下面的行添加到chrome选项中。

 options.add_argument(r"--user-data-dir=path\to\chrome\user data\any_new_profile_name")
 # below is the sample
 options.add_argument(r"--user-data-dir=C:\Users\xxxx\AppData\Local\Google\Chrome\User Data\ChromeAutoProfile")

您不必创建新的chrome配置文件,如果该配置文件不存在,则脚本会在第一次创建该配置文件。