查找锚标签的文本,这些锚标签是名为div的特定类的子级

时间:2018-11-18 21:08:07

标签: python-3.x beautifulsoup

<div class="outer">
 <div class= ""></div>
 <div class= "inner">
   <a href= "..." class="innera">text1</a>
   <a href= "..." class="innera">text2</a>
   <a href= "..." class="innnera">text3</a>
 </div>
</div>

让我们说有一个外部div可以容纳几个子div。第一个没有类名,第二个包括锚标记。并且页面上有很多名为“ outer”的divs类。如何在这些标签内获取文字?我想计算div class =“ inner”内锚标记文本的数量。因为页面上有很多具有名为“ outer”的类的div,并且这些div在名为“ inner”的子div类中包含不同数量的href标记。

1 个答案:

答案 0 :(得分:1)

a放入div.outer > div.inner内进行循环

outers = soup.select('div.outer')
for inner in outers:
  atags = inner.select('div.inner a')
  print(len(atags))
  for a in atags:
    print(a['href'])