我正在尝试从包含div标签中嵌入的一些数据的网页中抓取数据。
url = 'http://london2012.fiba.com/pages/eng/fe/12/olym/p/gid/26/grid/A/rid/9087/sid/6233/game.html'
boxurl = urllib2.urlopen(url).read()
soup = BeautifulSoup(boxurl)
linescoreA = soup.find("div", {"class": "scoreA"})
print linescoreA
输出:
<div class="scoreA">
<div class="period">19</div>
<div class="period">22</div>
<div class="period">22</div><div class="period">26</div>
<div class="final">89</div>
<div class="clear"></div>
</div>
这就是我被卡住的地方。如何从div标签获取数据?
答案 0 :(得分:3)
要获取文字数据,请使用.stripped_strings
:
print list(linescoreA.stripped_strings)
答案 1 :(得分:1)
尝试
for node in soup.find("div", {"class": "scoreA"}):
print ''.join(node.findAll(text=True))
以及
for node in soup.find("div", {"class": "scoreA"}):
print node.string
对不起,我不能为你试试。