使用Python抓取此站点时出错

时间:2012-05-28 02:13:05

标签: python web-scraping

我无法从this weather website获取一些信息。我主要是试图检索'当前条件'信息表。 这是我到目前为止,但它给了我一些错误。

import urllib2
from BeautifulSoup import BeautifulSoup
soup = BeautifulSoup(urllib2.urlopen('http://www.timeanddate.com/weather/usa/los-angeles').read())

for row in soup('table', {'class' : 'rpad'})[0].tbody('trtd'):
tds = row('tr')
print tds.string

1 个答案:

答案 0 :(得分:0)

#!/usr/bin/env python
import urllib2
from bs4 import BeautifulSoup
soup = BeautifulSoup(urllib2.urlopen('http://www.timeanddate.com/weather/usa/los-angeles').read())

for tr in soup.table.find_all('tr'):
    if tr('th'):
        if tr.th.string == "Current conditions":
            tds = tr('td')
            for td in tds:
                print td.string

我的解决方案,运行时输出如下:

None
Location:
Los Angeles / USC Campus Downtown
Temperature:
63 °F
Comfort Level:
63 °F
Dew point:
51 °F
Pressure:
29.94 "Hg
Humidity:
65%
Visibility:
10 mi
Wind:
No wind
Last update:
Sun 7:47 PM PDT

由于我累了,没有花费额外的时间在第一个输出的无检查中添加。此外,没有任何格式正在进行,这很明显,但这并不会太难加入。

希望能帮到你。