我正试图从网站上刮取一张桌子而无法获得位置列以显示

时间:2016-04-21 07:08:16

标签: python html web-scraping beautifulsoup html-table

import urllib2
from bs4 import BeautifulSoup

url = "http://www.virtualpronetwork.com/apps/fvpaa/simulation/freeagents/13/ANY/"  

page = urllib2.urlopen(url).read()
soup = BeautifulSoup(page)


with open('output.txt', 'w') as f:
    for tr in soup.find_all('tr')[2:]:  
        tds = tr.find_all('td')
    f.write("player: %s, Team: %s, Pos: %s" % \
    (tds[0].text, tds[1].text, tds[2].text))

我也希望能够同时提取多个页面。我想我可以使用id命令并在URL的末尾添加(+ id),但我不确定。我想把它写成一个excel文件,我知道我也可以用csv做,但我不知道怎么把它放到单独的列中。然而,主要的事情是让最后一列(位置)显示,并且即使我需要输入文件也能够同时提取多个页面。发布的网站是我试图从中提取数据的网站。

我的输出附加为图片Output

0 个答案:

没有答案