我正在一个刮板项目上,目标之一是从网站的HTML和CSS获取每个图像链接。我当时使用BeautifulSoup和TinyCSS做到了,但是现在我想在Selenium上切换所有内容,因为我可以加载JS。
我在文档中找不到无需知道标签/标识/类的目标CSS参数的方法。我可以轻松地从HTML获取图像,但是我需要从CSS中定位每个“ background-image”参数,以便从中获取URL。
例如:背景图片:url(“ paper.gif”);
有没有办法做到这一点,还是我应该循环进入每个元素并检查相应的CSS(这会很费时)?
答案 0 :(得分:1)
您可以获取所有样式标签,然后解析它们,搜索外观。
您还可以使用资源URL下载css文件并进行解析。
您还可以创建XPATH / CSS规则来搜索包含您要查找的参数的节点。