我正在使用beautifulsoup解析html文件。但是,find_all()方法缺少某些标签。 html链接为YARN-8569
代码在这里:
componentWillUpdate(nextProps, nextState) {
if (nextState.gallerySwiper && nextState.thumbnailSwiper) {
const { gallerySwiper, thumbnailSwiper } = nextState
gallerySwiper.controller.control = thumbnailSwiper;
thumbnailSwiper.controller.control = gallerySwiper;
var swiperSlide = document.getElementsByClassName('swiper-zoom-container')
for(var index = 0; index<swiperSlide.length; index++){
swiperSlide[index].addEventListener('mouseover',function(e){
gallerySwiper.zoom.in();
})
swiperSlide[index].addEventListener('mouseout',function(e){
gallerySwiper.zoom.out();
})
}
}
}
但是,我只能使用“ js-diff-progressive-container”类打开第一个div标签并获取其子标签。对于第二个,我将得到一个类名称为'js-diff-progressive-retry'的开发人员(我在html文件中找不到此名称)。另外,我无法获得其子标签。
输出为
我使用lxml作为我的htmlparser(这是其他人建议的答案,但仍然无法正常工作)