使用Beautifulsoup时缺少标签

时间:2018-11-04 12:10:14

标签: python beautifulsoup html-parsing

我正在使用beautifulsoup解析html文件。但是,find_all()方法缺少某些标签。 html链接为YARN-8569

htmlfile snapshot.jpg

代码在这里:

componentWillUpdate(nextProps, nextState) {
  if (nextState.gallerySwiper && nextState.thumbnailSwiper) {
    const { gallerySwiper, thumbnailSwiper } = nextState

    gallerySwiper.controller.control = thumbnailSwiper;
    thumbnailSwiper.controller.control = gallerySwiper;

    var swiperSlide = document.getElementsByClassName('swiper-zoom-container')
    for(var index = 0; index<swiperSlide.length; index++){
      swiperSlide[index].addEventListener('mouseover',function(e){
        gallerySwiper.zoom.in();
      })
      swiperSlide[index].addEventListener('mouseout',function(e){
        gallerySwiper.zoom.out();
      })
    }
  }
}

但是,我只能使用“ js-diff-progressive-container”类打开第一个div标签并获取其子标签。对于第二个,我将得到一个类名称为'js-diff-progressive-retry'的开发人员(我在html文件中找不到此名称)。另外,我无法获得其子标签。

输出为

output.jpg

我使用lxml作为我的htmlparser(这是其他人建议的答案,但仍然无法正常工作)

0 个答案:

没有答案