我已经剪下标签,但是有人可以帮我从下面的标签中取出数字吗?
<span class="comments">7</span>
如何从中取出7个?
print(tag.get('[0-9].+)', None))
这为什么不起作用?
答案 0 :(得分:0)
使用正则表达式
span = "<span class='comments'>7983</span>"
import re
number = re.findall(r"[0-9]+",span)
print(number[0])
输出:
'7983'
答案 1 :(得分:0)
另一种使用SimplifiedDoc的方法:)
from simplified_scrapy import SimplifiedDoc,utils
html = '''
<span class="comments">7</span>
'''
doc = SimplifiedDoc(html)
print (doc.span.text)
结果:
7