Question

我想使用selenium从网页中提取图像。我正在尝试的代码是

import os
import selenium
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
from bs4 import BeautifulSoup
driver = webdriver.Ie()
url_database =  "https://www-nass.nhtsa.dot.gov/nass/cds/CaseForm.aspx?xsl=main.xsl&CaseID=773013618"
driver.get(url_database)
driver.switch_to.frame(driver.find_element_by_id('menu'))
element = driver.find_elements_by_xpath("//a[@class='menu' and contains(@onclick,'toggleswitch(this)') and contains(.,'Front') and contains(@href,'javascript')]")[0]
driver.execute_script("arguments[0].click();", element)
driver.switch_to.default_content()
driver.switch_to.frame(driver.find_element_by_id('menu'))

soup = BeautifulSoup(driver.page_source, "lxml")
for link in soup.findAll('href'):
    print(link)

它有一些带有java脚本链接的图像。如何提取其中的所有图像。

Answer 1

您的图片显示在src标记中，而不在href标记

中

下载文件： -

获取图像的SRC属性。
使用ImageIO.read将图像读取到BufferedImage
使用ImageIO.write函数保存BufferedImage

来源： -

How to download an image using Selenium (any version)?

参考： -

如何用java脚本链接提取图像？

1 个答案: