我试图从html文件中删除Span标记。
我正在使用一个包含很多Span标签的页面。我需要提取一些数字并将它们加在一起。但是,我甚至无法得到我需要的线路,所以我希望有人可以提供一些建议。
我的代码如下:
from urllib.request import urlopen
from bs4 import BeautifulSoup
import ssl
# Ignore SSL certificate errors
ctx = ssl.create_default_context()
ctx.check_hostname = False
ctx.verify_mode = ssl.CERT_NONE
# url = input('Enter - ')
html = urlopen(url, context=ctx).read()
soup = BeautifulSoup(html, "html.parser")
# print(soup)
spans = soup.findAll('span')
for span in spans:
print span
由于