<div class="number" title="Player number">1211</div>
<div class="shirt" title="sName">Ronaldo 1211</div>
我正在抓一个网站。我已经设法打印出来了。这是我的代码:
web = urllib2.urlopen("WEBSITE")
soupit = BeautifulSoup(web, 'html.parser')
scrapeme = soupit.findAll("div", { "class" : "number" })
print scrapeme
打印出来:
<div class="id" title="Player number">1211</div>
我希望它只打印1211.我该怎么做?
答案 0 :(得分:2)
任何beautifulsoup对象的get_ text()
方法就是这样做的。
---
theme_name: origin
meta_images: true
disqus_account: changeme
show_comments: false
globals:
0:
name: phone
display: Phone
value: foo
1:
name: email
display: Email
value: foo2
phone: foo
email: foo3
答案 1 :(得分:0)
获得元素列表scrapeme
后,您可以遍历列表中的每个元素并使用以下方式打印文本属性:
for element in scrapeme:
print(element.text)
因为在你的例子中scrape只生成一个包含一个元素的列表scrapeme
,所以在这种情况下输出只是:
1211