Xpath选择多个类

时间:2012-10-10 00:36:23

标签: python html xpath html-parsing lxml

<div class="one">
    <a class="two" href="Something..."><img src="http://..."/></a>
    <p> stuff.... </p>
    <p><img src="http://....." /></p>
</div>

我正在解析这个愚蠢的HTML,因为你可以看到有一个名为 one 的主类,另一个名为 two 的嵌套。 我正在尝试解析类 one 中的所有图像,但显然我所拥有的XPath只捕获一个图像,这是来自类一个

的图像

我试过了:

//div[@class="one"]/img | //a[@class="two"]/img

但显然我没有从两个类中删除,但是只有来自一个的类才能做到这一点吗?

我正在使用lxml.html的xpath功能。

1 个答案:

答案 0 :(得分:1)

试试这个Xpath表达式:

//div[@class="one"]//img

测试:

xmllint --html --xpath '//div[@class="one"]//img' \
    'http://sputnick-area.net/ftp/downloads/testSO.html'

<强>输出

<img src="http://...">
<img src="http://.....">