当跨度涉及Python时,如何刮取img源和数据的名称

时间:2014-02-08 21:24:01

标签: python web-scraping beautifulsoup

我创建了一个从网站上删除表格的代码,但由于某种原因,它只删除了部分信息。当我使用.String时,它会为所需的其他两个数据打印无。当我删除.string时,它会提示li类和我需要的数据以及span。它还打印出图像源,但我只需要图像的名称和夹具。

我的代码是;

import urllib2

from BeautifulSoup import BeautifulSoup
soup = BeautifulSoup(urllib2.urlopen('http://www.livefootballontv.com/').read())

for row in soup('div', {'id': 'tv-guide'})[0]('ul'):
    tds = row('li')
    #ths = row('th')
    print tds[0].string, tds[1], tds[2].string, tds[3].string, '/n'

打印出来;

2014年2月8日星期六Central Coast Mariners vs Melbourne VictoryHyundai A League 06:30 am None / n

1 个答案:

答案 0 :(得分:0)

不得不在跨度上使用.text而另一个我使用.img ['alt']这很好用