Python:在Selenium Google ChromeDriver中禁用图片

时间:2015-01-21 15:01:21

标签: python google-chrome selenium web-scraping web-crawler

我花了很多时间搜索这个。 在一天结束时,我结合了一些答案,它的确有效。我分享了我的答案,如果有人编辑它或为我们提供更简单的方法,我会很感激。

1- Disable images in Selenium Google ChromeDriver中的答案适用于Java。所以我们应该在Python中做同样的事情:

opt = webdriver.ChromeOptions()
opt.add_extension("Block-image_v1.1.crx")
browser = webdriver.Chrome(chrome_options=opt)

2-但是下载“Block-image_v1.1.crx”有点棘手,因为没有直接的方法可以做到这一点。为此目的,而不是去:https://chrome.google.com/webstore/detail/block-image/pehaalcefcjfccdpbckoablngfkfgfgj

你可以去http://chrome-extension-downloader.com/ 并将扩展URL粘贴到那里以便能够下载扩展文件。

3-然后,您将能够将上述代码与您下载的扩展文件的路径一起使用。

3 个答案:

答案 0 :(得分:62)

以下是禁用图片的另一种方法:

from selenium import webdriver

chrome_options = webdriver.ChromeOptions()
prefs = {"profile.managed_default_content_settings.images": 2}
chrome_options.add_experimental_option("prefs", prefs)
driver = webdriver.Chrome(chrome_options=chrome_options)

我在下面找到了它:

http://nullege.com/codes/show/src@o@s@osintstalker-HEAD@fbstalker1.py/56/selenium.webdriver.ChromeOptions.add_experimental_option

答案 1 :(得分:2)

Java: 有了Chrome,Firefox也不会加载图像。语法不同,但是参数上的字符串相同。

    chromeOptions = new ChromeOptions();
    HashMap<String, Object> images = new HashMap<String, Object>();
    images.put("images", 2);
    HashMap<String, Object> prefs = new HashMap<String, Object>();
    prefs.put("profile.default_content_setting_values", images);
    chromeOptions.setExperimentalOption("prefs", prefs);
    driver=new ChromeDriver(chromeOptions);

    firefoxOpt = new FirefoxOptions();
    FirefoxProfile profile = new FirefoxProfile();
    profile.setPreference("permissions.default.image", 2);
    firefoxOpt.setProfile(profile);

答案 2 :(得分:1)

还有另一种方法可能让每个人都能够访问chrome://settings,然后通过selenium进行设置我就这样开始只是出于教诲的好奇心,但后来我遇到了一个阴影根元素的森林当你遇到超过3个影子根元素与动态内容相结合显然是一种混淆并使其无法自动化的方法,虽然理论上可能至少听起来这种方法看起来更像是死路一条,但我会留下这个答案使用示例代码,仅用于纯粹的学习目的,以宣传那些想要接受挑战的人。。当您发现按钮此时无法点击时,不仅很难找到由于阴影根和动态更改而导致的内容设置。

driver = webdriver.Chrome()


def expand_shadow_element(element):
  shadow_root = driver.execute_script('return arguments[0].shadowRoot', element)
  return shadow_root

driver.get("chrome://settings")
root1 = driver.find_element_by_tag_name('settings-ui')
shadow_root1 = expand_shadow_element(root1)

root2 = shadow_root1.find_element_by_css_selector('[page-name="Settings"]')
shadow_root2 = expand_shadow_element(root2)

root3 = shadow_root2.find_element_by_id('search')
shadow_root3 = expand_shadow_element(root3)

search_button = shadow_root3.find_element_by_id("searchTerm")
search_button.click()

text_area = shadow_root3.find_element_by_id('searchInput')
text_area.send_keys("content settings")

root0 = shadow_root1.find_element_by_id('main')
shadow_root0_s = expand_shadow_element(root0)


root1_p = shadow_root0_s.find_element_by_css_selector('settings-basic-page')
shadow_root1_p = expand_shadow_element(root1_p)


root1_s = shadow_root1_p.find_element_by_css_selector('settings-privacy-page')
shadow_root1_s = expand_shadow_element(root1_s)

content_settings_div = shadow_root1_s.find_element_by_css_selector('#site-settings-subpage-trigger')
content_settings = content_settings_div.find_element_by_css_selector("button")
content_settings.click()