编辑BeautifulSoup ResultSet中的内容

时间:2013-05-29 15:07:39

标签: python parsing web-scraping beautifulsoup

我最终的目标是在BeautifulSoup ResultSet中添加数字:

[<span class="u">1,677</span>, <span class="u">114</span>, <span class="u">15</span>]

<class 'BeautifulSoup.ResultSet'>

因此,最终得到: sum = 1806

但似乎迭代列表的常用技术在这里不起作用。 最后我知道我必须提取数字,删除逗号,然后将它们添加起来。但我有点卡住了,特别是提取数字。

非常感谢一些帮助。感谢

1 个答案:

答案 0 :(得分:1)

似乎通常的迭代技术对我有用。这是我的代码:

from bs4 import BeautifulSoup
# or `from BeautifulSoup import BeautifulSoup` if you are using BeautifulSoup 3

text = "<html><head><title>Test</title></head><body><span>1</span><span>2</span></body></html>"
soup = BeautifulSoup(text)
spans = soup.findAll('span')
total = sum(int(span.string) for span in spans)
print(total)
# 3

你有什么尝试?您是否有任何可能与我们合作的错误消息?