Question

我正在尝试从包含div标签中嵌入的一些数据的网页中抓取数据。

url = 'http://london2012.fiba.com/pages/eng/fe/12/olym/p/gid/26/grid/A/rid/9087/sid/6233/game.html'
boxurl = urllib2.urlopen(url).read()
soup = BeautifulSoup(boxurl)

linescoreA = soup.find("div", {"class": "scoreA"})

print linescoreA

输出：

<div class="scoreA">
<div class="period">19</div>
<div class="period">22</div>
<div class="period">22</div><div class="period">26</div>
<div class="final">89</div>
<div class="clear"></div>
</div>

这就是我被卡住的地方。如何从div标签获取数据？

Answer 1

要获取文字数据，请使用.stripped_strings：

print list(linescoreA.stripped_strings)

Answer 2

尝试

for node in soup.find("div", {"class": "scoreA"}):
    print ''.join(node.findAll(text=True))

以及

for node in soup.find("div", {"class": "scoreA"}):
        print node.string

对不起，我不能为你试试。

从div标签Python中提取数据

2 个答案: