查找背景图像是否用于任何具有内联样式的html标记

时间:2012-08-02 10:02:31

标签: python html parsing xpath lxml

如何查找具有背景图像的所有标签? 没有使用样式表。所有样式都在标签中内嵌。

我目前正在使用 lxml 和xpath。这是我能走得多远:

from lxml import html  
html_text = """somehtml"""

doc = html.fromstring(html_text)  
tagWithBackgrounds = doc.xpath("//*[contains(@style,'background')]")

下一步是什么?

2 个答案:

答案 0 :(得分:1)

doc.xpath('//*[contains(@style,"background") and contains(@style,"url(")]')

不完美,但有效。

答案 1 :(得分:0)

根据xmlme.com's XpathTool,这个xPath应该可以工作:

//*[contains(@style,'background-image')]

这是我的测试结果:

enter image description here