美丽的汤第一个孩子在thia html web刮

时间:2016-04-06 16:48:50

标签: python html web-scraping beautifulsoup

我在这里有一个示例html http://cyberrule.netii.net/1.html 我想得到第一代的孩子 我试过这个

nav = soup.find( 'nav' )
child_li = nav.findAll("li", { "class" : "dropdown" })

但这只给了我一个带有课程下拉列表的列表。 列表的底部缺失。 我希望将它们全部放在一个数组中进行逐步处理。

1 个答案:

答案 0 :(得分:3)

传递recursive=False参数以查找直接子项。

nav = soup.find( 'nav' )
child_li = nav.ul.find_all("li", recursive=False)
for c in child_li:
    print c.text

https://www.crummy.com/software/BeautifulSoup/bs4/doc/#the-recursive-argument