我正在使用beautifulsoup来抓取一些基本数据。我需要的源代码部分是:
<div class="header-team">Team name 1</div>
<div class="header-team">Team name 2</div>
两条线并不相邻。
我正在尝试这个:
for team in soup.findAll('div', 'header-team')
print team
但是返回所有代码。我尝试添加.text但它返回错误。
答案 0 :(得分:1)
下面的代码对我有用 -
from bs4 import BeautifulSoup as bs
data = """<div class="header-team">Team name 1</div>
<div class="header-team">Team name 2</div>"""
soup = bs(data,'lxml')
for team in soup.findAll('div', 'header-team'):
print team.text
输出 -
Team name 1
Team name 2