有没有办法使用BeautifulSoup计算表格标签的数量?

时间:2015-02-15 00:45:22

标签: web-scraping beautifulsoup

我正在尝试通过维基百科网站废弃并显示表格,但表格编号将由用户指定。

所以我想,从页面中获取表格标签的数量,循环并显示用户指定的数字并显示表格。

到目前为止,我只能显示表格的内容。

from bs4 import BeautifulSoup
import urllib2
from lxml.html import fromstring


import re

wiki = "http://en.wikipedia.org/wiki/List_of_Test_cricket_records"

header = {'User-Agent': 'Mozilla/5.0'} #Needed to prevent 403 error on Wikipedia

req = urllib2.Request(wiki,headers=header)

page = urllib2.urlopen(req)

soup = BeautifulSoup(page)



table = soup.findAll("table")


for row in table :

    td=row.findAll("tr")

    for data in td :

        cells = data.findAll("td")

有更好的方法吗?请指导我。

0 个答案:

没有答案