Question

<div class="number" title="Player number">1211</div>
<div class="shirt" title="sName">Ronaldo 1211</div>

我正在抓一个网站。我已经设法打印出来了。这是我的代码：

web = urllib2.urlopen("WEBSITE")
soupit = BeautifulSoup(web, 'html.parser')
scrapeme = soupit.findAll("div", { "class" : "number" })
print scrapeme

打印出来：

<div class="id" title="Player number">1211</div>

我希望它只打印1211.我该怎么做？

Answer 1

任何beautifulsoup对象的get_ text()方法就是这样做的。

---
theme_name: origin
meta_images: true
disqus_account: changeme
show_comments: false
globals:
  0:
    name: phone
    display: Phone
    value: foo
  1:
    name: email
    display: Email
    value: foo2
  phone: foo
  email: foo3

Answer 2

获得元素列表scrapeme后，您可以遍历列表中的每个元素并使用以下方式打印文本属性：

for element in scrapeme:
    print(element.text)

因为在你的例子中scrape只生成一个包含一个元素的列表scrapeme，所以在这种情况下输出只是：

Python使用没有标签的beautifulsoup打印数据

2 个答案: