从python var中包含的页面源获取输入

时间:2016-11-24 13:54:39

标签: python request urllib2

我有一个使用urllib2发出请求的Python脚本,并使用以下内容存储在var的整个网页源代码中:

source = urlopen(request).read().decode()

假设source变量

中有以下html输入
<input name="form1" type="hidden" value="value1">

如何获取var中包含的输入值?我可以为此做一个示例代码吗?

编辑:

正如所建议的那样,像这样的BeautifulSoup代码应该有用吗?

soup = BeautifulSoup(source, 'html.parser')
for value in soup.find(name='value1'):
    value = value.get('value')

1 个答案:

答案 0 :(得分:0)

您需要使用BeautifulSoup。所以,假设你要提取value属性的值。这是你如何做到的:

import BeautifulSoup
import urllib2

request = "http://example.com"
source = urllib2.urlopen(request).read().decode()
# Or you can test with:
# source = "<input name='form1' type='hidden' value='value1'>"
soup = BeautifulSoup(source, "html.parser")
value = soup.find("input", {"name": "form1"}).get("value")