是否可以使用Selenium复制Firefox工具->页面信息->媒体的内容?

时间:2018-12-26 02:18:19

标签: selenium firefox web-crawler

在Firefox中查看页面时,Media-> Tools中的Page Info表显示了包括图像,背景,视频等在内的媒体列表。是否可以访问该列表的内容还是通过Selenium构建相同的列表?

使用Python,我可以使用类似的方式获取嵌入式媒体

driver.find_elements_by_xpath(" //*[contains(@src,'.png') or contains(@src,'.jpg')]")
通过链接contains语句

覆盖可能的媒体文件类型,例如jpg,jpeg,png,gif等的语句。 可以对style属性应用相同的操作,以在背景图像css属性中查找具有图像的元素。

driver.find_elements_by_xpath(" //*[contains(@style,'.png') or contains(@style,'.jpg')]")

从这些列表中,可以推断出地址和类型,类似于在媒体窗口中显示它们的方式。但是,这些方法无法涵盖少数情况:

  1. 收藏夹图标,显然是can't be obtained using Selenium
  2. 其地址不包含其关联文件类型的可读媒体,例如通过php链接提供的图像。
  3. 媒体用作原始数据,通常是用于跟踪的单个像素图像。

我不确定如何处理这些问题,或者不确定是否有更好的方法来访问Firefox已经处理过的媒体资源列表。

0 个答案:

没有答案