在python中从html获取价值的最佳方法?

时间:2016-10-08 17:05:42

标签: python regex web-scraping

所以我想在python中抓取属性值,目前我正在使用正则表达式,但它并没有那么有效,所以我想知道我应该使用什么,因为很多人说正则表达式对这样的事情不好。

由于

这就是我想要的。

<input type="hidden" name="test" value="99948555"> 

值始终包含随机数。

1 个答案:

答案 0 :(得分:1)

我会使用 BeautifulSoup 进行此类解析:

from bs4 import BeautifulSoup
html = '<input type="hidden" name="test" value="99948555">'
soup = BeautifulSoup(html, 'html.parser')
print(soup.find('input')['name'], ':', soup.find('input')['value'])
# outputs : "test : 99948555"

您在这里寻找的是:soup.find('input')['value']

请参阅文档以了解用法和示例: https://www.crummy.com/software/BeautifulSoup/bs4/doc/

您可以像这样安装:

[python_binary] -m pip install bs4