<div class="one">
<a class="two" href="Something..."><img src="http://..."/></a>
<p> stuff.... </p>
<p><img src="http://....." /></p>
</div>
我正在解析这个愚蠢的HTML,因为你可以看到有一个名为 one 的主类,另一个名为 two 的嵌套。 我正在尝试解析类 one 中的所有图像,但显然我所拥有的XPath只捕获一个图像,这是来自类一个
的图像我试过了:
//div[@class="one"]/img | //a[@class="two"]/img
但显然我没有从两个类中删除,但是只有来自一个的类才能做到这一点吗?
我正在使用lxml.html的xpath功能。
答案 0 :(得分:1)
试试这个Xpath
表达式:
//div[@class="one"]//img
测试:
xmllint --html --xpath '//div[@class="one"]//img' \
'http://sputnick-area.net/ftp/downloads/testSO.html'
<强>输出强>
<img src="http://...">
<img src="http://.....">