我有一个使用urllib2发出请求的Python脚本,并使用以下内容存储在var的整个网页源代码中:
source = urlopen(request).read().decode()
假设source
变量
<input name="form1" type="hidden" value="value1">
如何获取var中包含的输入值?我可以为此做一个示例代码吗?
编辑:
正如所建议的那样,像这样的BeautifulSoup代码应该有用吗?
soup = BeautifulSoup(source, 'html.parser')
for value in soup.find(name='value1'):
value = value.get('value')
答案 0 :(得分:0)
您需要使用BeautifulSoup。所以,假设你要提取value
属性的值。这是你如何做到的:
import BeautifulSoup
import urllib2
request = "http://example.com"
source = urllib2.urlopen(request).read().decode()
# Or you can test with:
# source = "<input name='form1' type='hidden' value='value1'>"
soup = BeautifulSoup(source, "html.parser")
value = soup.find("input", {"name": "form1"}).get("value")