我正在尝试找到一个在网址页面中返回值的好方法。
我希望每次列出“span class =”按钮“我都可以抓住下一行
"span class=" button" 0.87
我想得到0.87
我在尝试:
import urllib
url = 'http://test.com'
sock = urllib.urlopen(url)
content = sock.read().splitlines()
sock.close()
for i in content:
i = i.strip()
这是我陷入困境的地方,我如何获得下一行?
答案 0 :(得分:2)
如果这是HTML,您可以使用像BeautifulSoup
这样的html解析器buttons = soup.findAll('span', {'class': 'button'})
for button in buttons:
button.nextSibling
这会使用nextSibling
,看起来在最新版本的美味汤中它已被更改为next_sibling
?
Python有一个内置的HTMLParser 如果您的数据是
<span class="button">
0.87
</span>
你可以在example
中创建一个类