Python使用没有标签的beautifulsoup打印数据

时间:2015-09-06 21:59:45

标签: python python-2.7 beautifulsoup screen-scraping

<div class="number" title="Player number">1211</div>
<div class="shirt" title="sName">Ronaldo 1211</div>

我正在抓一个网站。我已经设法打印出来了。这是我的代码:

web = urllib2.urlopen("WEBSITE")
soupit = BeautifulSoup(web, 'html.parser')
scrapeme = soupit.findAll("div", { "class" : "number" })
print scrapeme

打印出来:

<div class="id" title="Player number">1211</div>

我希望它只打印1211.我该怎么做?

2 个答案:

答案 0 :(得分:2)

任何beautifulsoup对象的get_ text()方法就是这样做的。

---
theme_name: origin
meta_images: true
disqus_account: changeme
show_comments: false
globals:
  0:
    name: phone
    display: Phone
    value: foo
  1:
    name: email
    display: Email
    value: foo2
  phone: foo
  email: foo3

答案 1 :(得分:0)

获得元素列表scrapeme后,您可以遍历列表中的每个元素并使用以下方式打印文本属性:

for element in scrapeme:
    print(element.text)

因为在你的例子中scrape只生成一个包含一个元素的列表scrapeme,所以在这种情况下输出只是:

1211