import urllib2
from bs4 import BeautifulSoup
url = "http://www.virtualpronetwork.com/apps/fvpaa/simulation/freeagents/13/ANY/"
page = urllib2.urlopen(url).read()
soup = BeautifulSoup(page)
with open('output.txt', 'w') as f:
for tr in soup.find_all('tr')[2:]:
tds = tr.find_all('td')
f.write("player: %s, Team: %s, Pos: %s" % \
(tds[0].text, tds[1].text, tds[2].text))
我也希望能够同时提取多个页面。我想我可以使用id命令并在URL的末尾添加(+ id),但我不确定。我想把它写成一个excel文件,我知道我也可以用csv做,但我不知道怎么把它放到单独的列中。然而,主要的事情是让最后一列(位置)显示,并且即使我需要输入文件也能够同时提取多个页面。发布的网站是我试图从中提取数据的网站。