我正在尝试通过维基百科网站废弃并显示表格,但表格编号将由用户指定。
所以我想,从页面中获取表格标签的数量,循环并显示用户指定的数字并显示表格。
到目前为止,我只能显示表格的内容。
from bs4 import BeautifulSoup
import urllib2
from lxml.html import fromstring
import re
wiki = "http://en.wikipedia.org/wiki/List_of_Test_cricket_records"
header = {'User-Agent': 'Mozilla/5.0'} #Needed to prevent 403 error on Wikipedia
req = urllib2.Request(wiki,headers=header)
page = urllib2.urlopen(req)
soup = BeautifulSoup(page)
table = soup.findAll("table")
for row in table :
td=row.findAll("tr")
for data in td :
cells = data.findAll("td")
有更好的方法吗?请指导我。