我试图在HTML表的第5列中获取值,具体取决于第1列的值。到目前为止,我只是尝试打印表中所有行的所有单元格。
html:the html table
我的剧本:
from bs4 import BeautifulSoup
url = "D:\opus\lt-report-opus_lmes_jenkins-20180510-111740\index.html"
page = open(url)
soup = BeautifulSoup(page.read(), 'html.parser')
table = soup.find('table', attrs={'id': 'statisticsTable'})
if table != None:
print ('Found the table ' + str(table))
for row in table.findChildren('tr'):
print (row)
for cell in row.findChildren('td'):
print (cell)
print (cell.text)
我找到了表格。 问题是' row'没有找到表中的行。所以什么都没有打印过。
为什么?