如何使用beautifulsoup在嵌套div中获取文本

时间:2017-02-11 12:48:13

标签: python css beautifulsoup lxml

嵌套div

<div class="a">
    <div class="b">first part text</div>
    second part text
</div>

这是我的代码

infos = soup.findAll("div", {"class": "a"})
print(infos[0].getText())

控制台打印件为first part textsecond part text。如何仅提取second part text

感谢您的回答。

1 个答案:

答案 0 :(得分:0)

  1. 使用find()返回find_all()
  2. 中的第一个元素
  3. 使用.查找div代码中的下一个infos并使用next_sibling查找文字
  4. infos = soup.find("div", {"class": "a"})
    print(infos.div.next_sibling)
    

    enter image description here