如何使用python从span标签中提取数字?

时间:2020-05-09 17:51:20

标签: python beautifulsoup

我已经剪下标签,但是有人可以帮我从下面的标签中取出数字吗?

<span class="comments">7</span>

如何从中取出7个?

print(tag.get('[0-9].+)', None))

这为什么不起作用?

2 个答案:

答案 0 :(得分:0)

使用正则表达式

 span = "<span class='comments'>7983</span>"
import re
number = re.findall(r"[0-9]+",span)
print(number[0])

输出:

'7983'

答案 1 :(得分:0)

另一种使用SimplifiedDoc的方法:)

from simplified_scrapy import SimplifiedDoc,utils
html = '''
<span class="comments">7</span>
'''
doc = SimplifiedDoc(html)
print (doc.span.text)

结果:

7