使用ScraperWiki从div元素获取信息

时间:2013-04-14 11:41:59

标签: python web-scraping scraperwiki

有没有办法从ScraperWiki的div容器中获取数据? 我有一行HTML,如:

<div id="karte_data_aktuelle_temperatur___CHA" class="karte_text_hidden">
    <span style="font-size: 10px;">9.0</span>
    <br/>
</div>

我想抓一下...CHA9.0。 值(9.0)不是问题,因为这可以通过CSS选择器完成,但是如何获得...CHA值?

1 个答案:

答案 0 :(得分:0)

我意识到这不是scraperwiki,而是BeautifulSoup,无论如何都要检查它。

html = r"""<div id="karte_data_aktuelle_temperatur___CHA" class="karte_text_hidden">
    <span style="font-size: 10px;">9.0</span>
    <br/>
</div>"""


from bs4 import BeautifulSoup

soup = BeautifulSoup(html)
elem = soup.find('div')

print elem['id'], 'is the id'
print elem.text, 'is the value' #9.0