尝试解析天气页面并选择每周预测的高点。
通常我会使用tags = soup.find_all("span", id="hi")
进行搜索,但此标记不使用id
,而是使用class
。
完整代码:
import mechanize
from bs4 import BeautifulSoup
my_browser = mechanize.Browser()
html_page = my_browser.open("http://www.wunderground.com/weather-forecast/45056")
html_text = html_page.get_data()
my_soup = BeautifulSoup(html_text)
tags = my_soup.find_all("span", class_="hi")
temp = tags[0].string
print temp
当我运行时,没有打印
这段HTML被埋在一堆其他标签中,但是今天的高标签如下:
<span class="hi">63</span>