python BeautifulSoup。如何获得多个相同标签下的第一个文本

时间:2017-09-06 14:25:27

标签: python beautifulsoup

如何获取多个相同标签下的第一个文本 我使用BeautifulSoup来获得一些相同的标签,我只想得到“text05”。

<p class="m-t-xs">test01
    <a class="a-blue" href="http://****">test02</a>
    <span class="m-l">test03</span>
    <span class="m-l">test04</span>
</p>
<p class="m-t-xs">test05
    <span class="m-l">test06</span>
</p>
<p class="m-t-xs">test07</p>

正如你所看到的,他们的课程是一样的。我怎样才能使用BeautifulSoup来获得我想要的东西。

1 个答案:

答案 0 :(得分:0)

soup = BeautifulSoup(data, 'html.parser')
tags = soup.findAll('p', {'class': 'm-t-xs'})

tags将成为p代码的列表。从相应的标签中选择您的数据:

tags[1].find(text = True).strip() # 'test05'