Python:刮擦多个表

时间:2017-05-08 16:50:29

标签: python web-scraping beautifulsoup

Canvas

我试图通过同一网站上的4个不同的表循环这个但我无法弄清楚如何编写循环。我已经对它进行了研究,似乎无法找到该做什么

这4个表位于0,1,2和6的位置。我已经尝试过切片数据以包含它们,但似乎没有任何东西可以工作

1 个答案:

答案 0 :(得分:2)

您可以找到符合过滤条件的所有表格,使用enumerate()获取索引,然后过滤掉"过滤掉"不受欢迎的索引表:

desired_indexes = {0, 1, 2, 6}
tables = soup.find_all('table', attrs={"responsive": "true"})
for index, table in enumerate(tables):
    if index not in desired_indexes:
        continue

    # do something with table

通常,依赖页面上元素的出现索引听起来不像是在页面上定位元素的可靠技术。