我正在尝试解析图片链接,该图片链接位于'img'标签here的'src'属性下
这是来自浏览器的html代码:
<img class="athenaProductImageCarousel_image" data-hide="false" alt="ARKK Copenhagen Men's Asymtrix Mesh Trainers - Off White Ash" aria-role="presentation" aria-hidden="true" src="//s1.thcdn.com/productimg/1600/1600/12024279-9854653309695274.jpg" srcset="//s1.thcdn.com/productimg/20/20/12024279-9854653309695274.jpg 20w,
//s1.thcdn.com/productimg/600/600/12024279-9854653309695274.jpg 600w, //s1.thcdn.com/productimg/270/270/12024279-9854653309695274.jpg 270w, //s1.thcdn.com/productimg/70/70/12024279-9854653309695274.jpg 70w,
//s1.thcdn.com/productimg/300/300/12024279-9854653309695274.jpg 300w, //s1.thcdn.com/productimg/480/480/12024279-9854653309695274.jpg 480w,
//s1.thcdn.com/productimg/50/50/12024279-9854653309695274.jpg 50w, //s1.thcdn.com/productimg/60/60/12024279-9854653309695274.jpg 60w,
//s1.thcdn.com/productimg/180/180/12024279-9854653309695274.jpg 180w, //s1.thcdn.com/productimg/1600/1600/12024279-9854653309695274.jpg 1600w,
//s1.thcdn.com/productimg/130/130/12024279-9854653309695274.jpg 130w, //s1.thcdn.com/productimg/960/960/12024279-9854653309695274.jpg 960w, //s1.thcdn.com/productimg/100/100/12024279-9854653309695274.jpg 100w,
//s1.thcdn.com/productimg/200/200/12024279-9854653309695274.jpg 200w,
//s1.thcdn.com/productimg/350/350/12024279-9854653309695274.jpg 350w">
</div>
这就是我从lxml中得到的东西:
<img class="athenaProductImageCarousel_image" data-hide="true" alt="ARKK Copenhagen Men's Asymtrix Mesh Trainers - Off White Ash" aria-role="presentation" aria-hidden="true"/>
</div>
我不知道为什么,我只是在使用这段代码:
该元素是用lxml解析的lxml标记对象
element.xpath('//img[@class="athenaProductImageCarousel_imagePreview"]')[0]
答案 0 :(得分:0)
如果无法访问整个HTML,将很难进行调试。
您确定页面上只有一个athenaProductImageCarousel_image
吗?
此外,您在lxml中使用了不同的类athenaProductImageCarousel_imagePreview
element.xpath('//img[@class="athenaProductImageCarousel_imagePreview"]')[0]
这是故意的吗?
答案 1 :(得分:0)
在这个类别上是否还有其他img元素?
看看element.xpath返回中是否没有其他元素
另一种想法,看来您使用的是错误的类。
您想要什么:
element.xpath('//img[@class="athenaProductImageCarousel_image"]')[0]