lxml无法看到已解析标签的属性

时间:2019-07-15 15:33:08

标签: python lxml

我正在尝试解析图片链接,该图片链接位于'img'标签here的'src'属性下

这是来自浏览器的html代码:

 <img class="athenaProductImageCarousel_image" data-hide="false" alt="ARKK Copenhagen Men's Asymtrix Mesh Trainers - Off White Ash" aria-role="presentation" aria-hidden="true" src="//s1.thcdn.com/productimg/1600/1600/12024279-9854653309695274.jpg" srcset="//s1.thcdn.com/productimg/20/20/12024279-9854653309695274.jpg 20w, 
//s1.thcdn.com/productimg/600/600/12024279-9854653309695274.jpg 600w, //s1.thcdn.com/productimg/270/270/12024279-9854653309695274.jpg 270w, //s1.thcdn.com/productimg/70/70/12024279-9854653309695274.jpg 70w, 
//s1.thcdn.com/productimg/300/300/12024279-9854653309695274.jpg 300w, //s1.thcdn.com/productimg/480/480/12024279-9854653309695274.jpg 480w, 
//s1.thcdn.com/productimg/50/50/12024279-9854653309695274.jpg 50w, //s1.thcdn.com/productimg/60/60/12024279-9854653309695274.jpg 60w, 
//s1.thcdn.com/productimg/180/180/12024279-9854653309695274.jpg 180w, //s1.thcdn.com/productimg/1600/1600/12024279-9854653309695274.jpg 1600w,
 //s1.thcdn.com/productimg/130/130/12024279-9854653309695274.jpg 130w, //s1.thcdn.com/productimg/960/960/12024279-9854653309695274.jpg 960w, //s1.thcdn.com/productimg/100/100/12024279-9854653309695274.jpg 100w, 
//s1.thcdn.com/productimg/200/200/12024279-9854653309695274.jpg 200w, 
//s1.thcdn.com/productimg/350/350/12024279-9854653309695274.jpg 350w">
    </div>

这就是我从lxml中得到的东西:

<img class="athenaProductImageCarousel_image" data-hide="true" alt="ARKK Copenhagen Men's Asymtrix Mesh Trainers - Off White Ash" aria-role="presentation" aria-hidden="true"/>
</div>

我不知道为什么,我只是在使用这段代码:

该元素是用lxml解析的lxml标记对象

element.xpath('//img[@class="athenaProductImageCarousel_imagePreview"]')[0]

2 个答案:

答案 0 :(得分:0)

如果无法访问整个HTML,将很难进行调试。 您确定页面上只有一个athenaProductImageCarousel_image吗?

此外,您在lxml中使用了不同的类athenaProductImageCarousel_imagePreview

element.xpath('//img[@class="athenaProductImageCarousel_imagePreview"]')[0]

这是故意的吗?

答案 1 :(得分:0)

在这个类别上是否还有其他img元素?

看看element.xpath返回中是否没有其他元素

另一种想法,看来您使用的是错误的类。

您想要什么:

element.xpath('//img[@class="athenaProductImageCarousel_image"]')[0]