我是使用Beautiful Soup的初学者,并且对'if'语句有疑问。
我正在尝试从网页中的表格中抓取数据,但是也有前排序表和后排序表。
所有必需的表都有形式的分隔,而无用的表具有各种分隔。
我想做的是使用find_all搜索所有表分区,然后循环遍历结果,并将所有.contents方法的分区附加到列表中,该方法的第一项是具有align ='属性的标签中心”,但我不知道如何将标签作为“美丽的汤”对象,并且不知道如何使用它。
我在下面尝试了代码,如果有人可以给我一些提示,将不胜感激。
import requests
from bs4 import BeautifulSoup
r = requests.get('https://afltables.com/afl/stats/2018.html')
soup = BeautifulSoup(r.text, 'html.parser')
results = soup.find_all('tr')
lists =[]
for result in results:
if result.contents[0] == 'align = centre':
#append to some list
答案 0 :(得分:1)
我相信,这将为您提供所需的东西。
for result in results:
if 'align="center"' in str(result.contents[0]):
#append to some list