python如果文本匹配则删除div

时间:2015-02-16 12:09:17

标签: html python-2.7

我正在使用 scrapy 抓取网站,并且有一个html结构:

<div>
  <div class = "mydiv">abc</div>
  <div class = "mydiv">xyz</div>
  <div class = "mydiv">ghi</div>
</div>

如果div中的文本与 xyz 匹配,我想删除div,包括包含文本的div和其后的所有其他div。我已经使用xpath成功提取了每个div中的文本。无论如何我可以在python中实现这一点。

由于第二个div内的文本与所需文本 xyz 匹配,因此需要删除第二个和第三个div 我的最终输出将是:

<div>
  <div class = "mydiv">abc</div>  
</div>

0 个答案:

没有答案