我正在尝试使用以下代码从here中提取设备名称,但我的输出返回每个项目大约26次。我试过找到一个合适的解决方案并空手而归。任何有关如何使这项工作的想法将不胜感激。
tables = soup.find_all('table')
for table in tables:
if table.find_parent("table") is not None:
for tr in table.find_all('tr'):
for td in table.find_all('td'):
for a in td.find_all('a'):
f2.write(a['title'] + '\n')
答案 0 :(得分:1)
让我们按部分说明,首先如何获得表格中的所有英雄名称:
heroes = soup.find_all('span', {'style': 'white-space:nowrap'})
for hero in heroes:
print hero.getText()
打印所有设备:
eqs = soup.find_all('div', {'style': 'margin:7px 5px 0px;vertical-align:top;text-align:center;display:inline-block;line-height:normal;width:120px;'})
for equipment in eqs:
print equipment.getText()