我是python的新手,需要一些从HTML表格中提取特定单元格值的指导。
我正在处理的网址here
我希望仅在Month和Settlement列中获取前5个值,然后将其显示为:
"MAR 14:426'6"
我面临的问题是:
这是我正在处理的代码:
tableData = soup1.find("table", id="DailySettlementTable")
for rows in tableData.findAll('tr'):
month = rows.find('td')
print month
感谢您并感谢任何形式的指导!
答案 0 :(得分:1)
您可能想要使用slicing。
以下是代码的修改代码段:
table = soup.find('table', id='DailySettlementTable')
# The slice notation below, [2:7], says to take the third (index 2)
# to the eighth (index 7) values from the rows we get.
for rows in table.find_all('tr')[2:7]:
cells = rows.find_all('td')
month = cells[0]
settle = cells[6]
print month.string + ':' + settle.string