<div class="outer">
<div class= ""></div>
<div class= "inner">
<a href= "..." class="innera">text1</a>
<a href= "..." class="innera">text2</a>
<a href= "..." class="innnera">text3</a>
</div>
</div>
让我们说有一个外部div可以容纳几个子div。第一个没有类名,第二个包括锚标记。并且页面上有很多名为“ outer”的divs类。如何在这些标签内获取文字?我想计算div class =“ inner”内锚标记文本的数量。因为页面上有很多具有名为“ outer”的类的div,并且这些div在名为“ inner”的子div类中包含不同数量的href标记。
答案 0 :(得分:1)
将a
放入div.outer > div.inner
内进行循环
outers = soup.select('div.outer')
for inner in outers:
atags = inner.select('div.inner a')
print(len(atags))
for a in atags:
print(a['href'])