Python Selenium Headless下载

时间:2018-10-16 07:30:24

标签: python selenium

我正在尝试使用硒下载文件。我已经搜索了所有内容。

How to control the download of files with Selenium Python bindings in Chrome,有人告诉它有效。 但这对我没有用!也许我想念什么?唯一不同的是,我的页面自动开始下载csv文件。

研究了镶边代码后,我添加了:

        "safebrowsing_for_trusted_sources_enabled": False

但仍然无法使用ID。

options = Options()
options.add_argument("--disable-notifications")
options.add_argument('--no-sandbox')
options.add_experimental_option("prefs", {
    "download.default_directory": "C:\\Users\\claudiu.ivanescu\\Downloads",
    "download.prompt_for_download": False,
    "download.directory_upgrade": True,
    "safebrowsing_for_trusted_sources_enabled": False
})
options.add_argument('--disable-gpu')
options.add_argument('--disable-software-rasterizer')
options.add_argument('--headless')

感谢支持

1 个答案:

答案 0 :(得分:5)

如果有人感兴趣,请在搜索2天后:)。我设法做到了!

我在此评论中找到了错误跟踪的答案:https://bugs.chromium.org/p/chromium/issues/detail?id=696481#c86

我使用的代码是:

def enable_downoad_headless(browser,download_dir):
    browser.command_executor._commands["send_command"] = ("POST", '/session/$sessionId/chromium/send_command')
    params = {'cmd':'Page.setDownloadBehavior', 'params': {'behavior': 'allow', 'downloadPath': download_dir}}
    browser.execute("send_command", params)

if __name__ == '__main__':
    options = Options()
    options.add_argument("--disable-notifications")
    options.add_argument('--no-sandbox')
    options.add_argument('--verbose')
    options.add_experimental_option("prefs", {
        "download.default_directory": "C:\\tmp",
        "download.prompt_for_download": False,
        "download.directory_upgrade": True,
        "safebrowsing_for_trusted_sources_enabled": False,
        "safebrowsing.enabled": False
    })
    options.add_argument('--disable-gpu')
    options.add_argument('--disable-software-rasterizer')
    options.add_argument('--headless')
    driver_path = "C:\\Users\\tmp\\chromedriver.exe"
    driver = webdriver.Chrome(driver_path, chrome_options=options)
    enable_downoad_headless(driver, "C:/tmp")
    driver.get(url)

将来可能会对其他人有所帮助... 里面可能有很多没用的东西,但是还没来得及改变:)。