BeautifulSoup Scraping返回重复结果

时间:2014-01-30 19:47:44

标签: python-2.7 web-scraping beautifulsoup

我正在尝试使用以下代码从here中提取设备名称,但我的输出返回每个项目大约26次。我试过找到一个合适的解决方案并空手而归。任何有关如何使这项工作的想法将不胜感激。

tables = soup.find_all('table')

for table in tables:
if table.find_parent("table") is not None:
    for tr in table.find_all('tr'):
        for td in table.find_all('td'):
            for a in td.find_all('a'):
                f2.write(a['title'] + '\n')

1 个答案:

答案 0 :(得分:1)

让我们按部分说明,首先如何获得表格中的所有英雄名称:

heroes = soup.find_all('span', {'style': 'white-space:nowrap'})
for hero in heroes:
    print hero.getText()

打印所有设备:

eqs = soup.find_all('div', {'style': 'margin:7px 5px 0px;vertical-align:top;text-align:center;display:inline-block;line-height:normal;width:120px;'})

for equipment in eqs:
    print equipment.getText()